21 de mayo de 2026

De "¿Qué pasó?" a "¿Qué pasará?"

Llevando la inteligencia predictiva a la BI conversacional con Genie, TabPFN y Agent Bricks

por Ryuta Yoshimatsu , Javier Poveda Panter, Dominik Safaric, Philipp Singer, Diana Kriuchkova, Sauraj Gambhir, Dael Williamson y Bryan Smith

Esta arquitectura fusiona Genie como una capa dinámica de ingeniería de características con TabPFN como un modelo de predicción sin entrenamiento, orquestado a través de Agent Bricks, ofreciendo respuestas predictivas directamente dentro de la BI conversacional.
Se acabaron los cuellos de botella. Los usuarios de negocio ya no tienen que esperar a que los equipos de ciencia de datos identifiquen tablas, extraigan datos de entrenamiento, seleccionen un modelo e interpreten los resultados. El pipeline se autogenera a partir de una pregunta en lenguaje natural.
El resultado: una única experiencia gobernada —respaldada por el linaje de Unity Catalog y la evaluación de MLflow— donde cualquier pregunta planteada como "dados los resultados históricos, predecir uno nuevo" se resuelve en segundos, no en días.

La inteligencia de negocios siempre ha consistido en responder preguntas. Para la mayoría de las organizaciones, esas preguntas han sido descriptivas (¿qué pasó el trimestre pasado?) o de diagnóstico (¿por qué se disparó el abandono de clientes en el sureste?). Databricks Genie ha hecho que estas preguntas sean radicalmente más accesibles, lo que permite a los usuarios de negocio obtener respuestas en lenguaje natural sin tener que escribir SQL ni esperar a un analista.

Pero las preguntas que impulsan las decisiones más importantes son predictivas. ¿Qué clientes tienen más probabilidades de abandonar el próximo trimestre? ¿Cómo cambiará la demanda si ajustamos los precios? ¿Qué probabilidad hay de que este solicitante de préstamo no pague? Históricamente, responder a estas preguntas ha requerido un conjunto de herramientas, habilidades y equipos completamente diferente: un científico de datos que explore los datos, valide su idoneidad para la predicción, realice la ingeniería de características, entrene un modelo y lo mantenga a medida que cambian las condiciones. El resultado: una frontera rígida entre el mundo de la BI, donde los usuarios de negocio operan con confianza, y el mundo de la analítica predictiva, donde solo los equipos especializados pueden adentrarse.

En una publicación de blog anterior, mostramos cómo TabPFN —un modelo fundacional para datos tabulares de Prior Labs— simplifica gran parte de ese flujo de trabajo predictivo al ofrecer predicciones de nivel de producción en una sola pasada hacia adelante. Sin embargo, seguía existiendo un cuello de botella clave: alguien todavía tenía que traducir la pregunta de negocio en un conjunto de datos bien estructurado antes de que TabPFN pudiera realizar una predicción. El modelo puede ser instantáneo, pero el trabajo necesario para alimentarlo no lo es.

Genie como ingeniero de características, TabPFN como modelo universal

Aquí es donde el rol de Genie pasa de responder preguntas a habilitar predicciones. Genie ya entiende los datos de una organización: sus esquemas, relaciones y semántica de negocio. Al combinar Genie con TabPFN dentro de un orquestador multiagente, creamos un bucle cerrado: Genie traduce dinámicamente una pregunta en lenguaje natural en los datos de entrada precisos que TabPFN necesita, y TabPFN transforma esos datos en una predicción en una sola pasada hacia adelante. Cada pregunta predictiva realizada durante la conversación recibe una respuesta personalizada sobre la marcha. El espacio de preguntas que se pueden responder se vuelve prácticamente ilimitado: cualquier pregunta que pueda plantearse como "dados los datos históricos con un resultado, predecir el resultado para un nuevo escenario" se puede responder en cuestión de segundos.

El resultado es una experiencia única y gobernada —basada en datos de Lakehouse con linaje completo y control de acceso a través de Unity Catalog— donde los usuarios de negocio realizan preguntas predictivas en la misma interfaz conversacional que utilizan para la analítica descriptiva.

En esta publicación, analizamos la arquitectura de la aplicación que hace esto posible, presentando cada componente técnico y mostrando cómo se integran para ofrecer inteligencia predictiva directamente dentro de la BI conversacional.

Video 1. Interacción con un supervisor multiagente con Genie y TabPFN a través de una interfaz de Databricks Apps

Arquitectura: un supervisor multiagente

El sistema está construido como un orquestador multiagente implementado como una Databricks App, que conecta los componentes principales utilizando Agent Bricks, una plataforma para crear e implementar agentes empresariales en Databricks. Genie actúa como un subagente para analítica estructurada de SQL sobre datos gobernados de Lakehouse. TabPFN está conectado a Unity Catalog como un servidor MCP externo. El sistema también admite subagentes adicionales y endpoints de servicio; se pueden agregar otras aplicaciones de Databricks o servidores MCP adicionales según sea necesario.

Cuando llega una pregunta predictiva, el orquestador ejecuta un flujo de trabajo agéntico e interpreta la intención de negocio del usuario. Si responder a la pregunta requiere un análisis predictivo, consulta a Genie para extraer los datos etiquetados adecuados del Lakehouse. Una vez recopilados todos los datos necesarios, llama a TabPFN y le pasa estos datos al modelo en el formato correcto. Por último, el supervisor interpreta las predicciones y ofrece una recomendación práctica al usuario (Figura 1).

Figura 1. Arquitectura de supervisor multiagente que combina Databricks Genie y TabPFN a través de MCP para habilitar analítica predictiva y descriptiva en tiempo real para usuarios de negocio

La idea central en acción

Para que esto sea más concreto, considere lo que sucede cuando un líder de ventas pregunta: "¿Qué tipo de promoción tendría más probabilidades de cerrar el acuerdo de Horton-Cross?"

En un flujo de trabajo tradicional, responder a esta pregunta requiere que un científico de datos comprenda la pregunta e identifique qué tablas y columnas son importantes; extraiga el conjunto de entrenamiento adecuado a partir de acuerdos históricos que incluyan tipos de promoción y resultados de ganancia/pérdida; seleccione un algoritmo, ajuste los hiperparámetros y valide el rendimiento; prepare los datos de inferencia específicos para el acuerdo de Horton-Cross; ejecute el modelo; y traduzca el resultado en una recomendación de negocio. Cada uno de estos pasos requiere tiempo, experiencia e iteración. Y la siguiente pregunta ("¿Cuál es la fecha óptima de seguimiento para maximizar la probabilidad de ganar?") requiere un modelo completamente diferente creado desde cero.

Ahora considere lo que sucede con Genie y TabPFN bajo el mismo supervisor multiagente. El supervisor interpreta la pregunta en lenguaje natural y su intención semántica, luego traduce esa intención en una solicitud específica para que Genie genere un conjunto de datos. Genie reconoce que responder a esta pregunta requiere oportunidades históricas combinadas con promociones y cuentas, utilizando la ganancia o pérdida como etiqueta, y genera SQL preciso para extraer estos datos al instante.

TabPFN recibe ese conjunto de datos y genera predicciones en una sola pasada hacia adelante: sin preprocesamiento de características, sin selección de modelo y sin ajuste de hiperparámetros. Por último, el supervisor devuelve una recomendación clara y basada en datos. Todo el pipeline —desde la pregunta hasta la predicción— se construye a partir del lenguaje natural en un solo turno de conversación.

Evaluación de la calidad y limitaciones

El patrón tiene limitaciones: TabPFN es tan bueno como los datos que produce Genie. Si Genie no puede construir un conjunto de datos significativo con una columna de etiqueta clara para una pregunta determinada (porque el esquema no captura la señal correcta, no existen las combinaciones necesarias o el resultado no está representado en los datos), entonces la predicción no será confiable, independientemente de la capacidad de TabPFN. Consulte las mejores prácticas para crear un espacio de Genie eficaz aquí. Además de esto, también existe un riesgo más amplio de que un agente pueda alucinar u omitir información clave durante una conversación de varios turnos.

Es exactamente por eso que la evaluación sistemática es esencial. A diferencia de un pipeline de ML estático que debe validarse una vez antes de la implementación, este sistema construye dinámicamente un problema de ML distinto para cada pregunta. Necesitamos un marco de evaluación para comprender dónde se encuentra el límite: qué clases de preguntas producen predicciones confiables y cuáles superan lo que Genie puede expresar como un conjunto de entrenamiento bien estructurado.

El acelerador de soluciones incluye un entorno de evaluación integral basado en el marco de evaluación de GenAI de MLflow. Se ejecuta en el agente en vivo y registra los resultados en MLflow Experiment Tracking, lo que brinda a los equipos un panel único para evaluar y monitorear la calidad a lo largo del tiempo. Puede encontrar todos los detalles aquí.

Video 2. Evaluación de un supervisor multiagente con Genie y TabPFN a través de la interfaz de Databricks Experiments.

Sin este bucle de evaluación, el sistema podría devolver predicciones con total confianza sin forma de distinguir las confiables de las que no lo son. Este enfoque riguroso garantiza la cobertura en todos los niveles: detecta regresiones conversacionales y de comportamiento, al tiempo que valida la corrección de extremo a extremo del pipeline predictivo. Juntas, estas comprobaciones brindan a los equipos la confianza necesaria para implementar este patrón en producción, con una comprensión clara de qué clases de preguntas producen predicciones confiables y dónde se encuentran los límites del sistema.

Primeros pasos

La combinación de Genie, TabPFN y Agent Bricks replantea la relación entre la analítica descriptiva y la predictiva. Genie se convierte en la capa de ingeniería de características. TabPFN elimina la sobrecarga de entrenamiento y mantenimiento. Agent Bricks proporciona la columna vertebral de orquestación y gobernanza, mientras que MLflow evalúa y monitorea la calidad de las respuestas. El resultado es que los usuarios de negocio pueden hacer preguntas predictivas en la misma interfaz conversacional que ya utilizan para la analítica descriptiva.

El acelerador de soluciones completo está disponible aquí. El repositorio incluye la generación de datos de muestra, la configuración de Genie Space y el entorno de evaluación de extremo a extremo descrito anteriormente. El patrón es independiente del dominio: aunque el acelerador demuestra la analítica de ventas empresariales, la misma arquitectura se aplica a cualquier dominio donde existan datos estructurados con resultados, incluyendo la evaluación de riesgos de salud, la predicción de calidad en la manufactura, la detección de fraudes financieros, el análisis de pérdida de clientes y más allá.

Comience hoy mismo y lleve la inteligencia predictiva a las conversaciones que sus equipos ya están teniendo.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.

Ver todos los blogs