Llevando la inteligencia predictiva a la BI conversacional con Genie, TabPFN y Agent Bricks
por Ryuta Yoshimatsu , Javier Poveda Panter, Dominik Safaric, Philipp Singer, Diana Kriuchkova, Sauraj Gambhir, Dael Williamson y Bryan Smith
La inteligencia de negocios siempre se ha tratado de responder preguntas. Para la mayoría de las organizaciones, esas preguntas han sido descriptivas — ¿qué pasó el último trimestre? — o diagnósticas — ¿por qué se disparó la rotación en el Sureste? Databricks Genie ha hecho estas preguntas radicalmente más accesibles, permitiendo a los usuarios de negocio obtener respuestas en lenguaje natural sin escribir SQL ni esperar a un analista.
Pero las preguntas que impulsan las decisiones más trascendentales son predictivas. ¿Qué clientes son propensos a la rotación el próximo trimestre? ¿Cómo cambiará la demanda si ajustamos los precios? ¿Qué probabilidad hay de que este solicitante de préstamo incumpla? Responder a estas preguntas ha requerido históricamente un conjunto completamente diferente de herramientas, habilidades y equipos — un científico de datos explorando los datos, validando su idoneidad para la predicción, diseñando características, entrenando un modelo y manteniendo ese modelo a medida que cambian las condiciones. El resultado: una frontera clara entre el mundo de la BI, donde los usuarios de negocio operan con confianza, y el mundo de la analítica predictiva, donde solo equipos especializados pueden incursionar.
En una publicación de blog anterior, mostramos cómo TabPFN — un modelo fundacional para datos tabulares de Prior Labs — simplifica gran parte de ese flujo de trabajo predictivo al entregar predicciones de grado de producción en una sola pasada hacia adelante. Pero persistía un cuello de botella clave: alguien aún necesitaba traducir la pregunta de negocio en un conjunto de datos bien formado antes de que TabPFN pudiera hacer una predicción. El modelo puede ser instantáneo, pero el trabajo que lo alimenta no lo es.
Aquí es donde el rol de Genie cambia de responder preguntas a habilitar predicciones. Genie ya comprende los datos de una organización — sus esquemas, relaciones y semántica de negocio. Al combinar Genie con TabPFN dentro de un orquestador multiagente, creamos un bucle cerrado: Genie traduce dinámicamente una pregunta en lenguaje natural en los datos de entrada precisos que TabPFN necesita, y TabPFN transforma esos datos en una predicción en una sola pasada hacia adelante. Cada pregunta predictiva formulada durante la conversación recibió una respuesta personalizada al instante. El espacio de preguntas que se pueden responder se vuelve esencialmente ilimitado — cualquier pregunta que pueda formularse como "dados datos históricos con un resultado, predecir un resultado para un nuevo escenario" puede responderse en segundos.
El resultado es una experiencia única y gobernada — basada en datos de Lakehouse con linaje completo y control de acceso a través de Unity Catalog — donde los usuarios de negocio hacen preguntas predictivas en la misma interfaz conversacional que usan para la analítica descriptiva.
En esta publicación, analizamos la arquitectura de la aplicación que hace esto posible, presentando cada componente técnico y mostrando cómo se unen para ofrecer inteligencia predictiva directamente dentro de la BI conversacional.
Video 1. Interacción con un supervisor multiagente con Genie y TabPFN a través de una interfaz de Databricks Apps
El sistema está construido como un orquestador multiagente desplegado como una Databricks App, que conecta los componentes principales usando Agent Bricks, una plataforma para construir y desplegar agentes empresariales en Databricks. Genie actúa como un subagente para el análisis SQL estructurado sobre datos gobernados de Lakehouse. TabPFN está conectado a Unity Catalog como un servidor MCP externo. El sistema también soporta subagentes adicionales y puntos finales de servicio; otras aplicaciones de Databricks, o servidores MCP adicionales, pueden añadirse según sea necesario.
Cuando llega una pregunta predictiva, el orquestador ejecuta un flujo de trabajo agéntico. Interpreta la intención de negocio del usuario. Si responder a la pregunta requiere análisis predictivo, consulta a Genie para extraer los datos etiquetados apropiados del Lakehouse. Después de haber recopilado todos los datos necesarios, llama a TabPFN, pasando estos datos al modelo en el formato correcto. Finalmente, el supervisor interpreta las predicciones y entrega una recomendación accionable al usuario (Figura 1).

Para hacerlo más concreto, considere lo que sucede cuando un líder de ventas pregunta: "¿Qué tipo de promoción tendría más probabilidades de cerrar el trato Horton-Cross?"
En un flujo de trabajo tradicional, responder a esta pregunta requiere que un científico de datos entienda la pregunta e identifique qué tablas y columnas son relevantes; extraiga el conjunto de entrenamiento correcto de acuerdos históricos que incluyan tipos de promoción y resultados de ganancia/pérdida; seleccione un algoritmo, ajuste los hiperparámetros y valide el rendimiento; prepare datos de inferencia específicos para el trato Horton-Cross; ejecute el modelo; y traduzca la salida en una recomendación de negocio. Cada uno de estos pasos requiere tiempo, experiencia e iteración. Y la siguiente pregunta — "¿Cuál es la fecha óptima para hacer un seguimiento y maximizar la probabilidad de ganar?" — requiere un modelo completamente diferente construido desde cero.
Ahora considere lo que sucede con Genie y TabPFN bajo el mismo supervisor multiagente. El supervisor interpreta la pregunta en lenguaje natural y su intención semántica, luego traduce esa intención en una solicitud específica para que Genie genere un conjunto de datos. Genie reconoce que responder a esta pregunta requiere oportunidades históricas unidas con promociones y cuentas, usando ganancia o pérdida como etiqueta, y genera SQL preciso para extraer estos datos al instante.
TabPFN recibe ese conjunto de datos y genera predicciones en una sola pasada hacia adelante — sin preprocesamiento de características, sin selección de modelo, sin ajuste de hiperparámetros. Finalmente, el supervisor devuelve una recomendación clara y basada en datos. Todo el pipeline — desde la pregunta hasta la predicción — se ensambla a partir del lenguaje natural en un solo turno de conversación.
El patrón tiene limitaciones: TabPFN es tan bueno como los datos que produce Genie. Si Genie no puede construir un conjunto de datos significativo con una columna de etiqueta clara para una pregunta dada, porque el esquema no captura la señal correcta, las uniones necesarias no existen, o el resultado no está representado en los datos, entonces la predicción no será fiable, independientemente de la capacidad de TabPFN. Consulte las mejores prácticas para construir un espacio Genie efectivo aquí. Además de esto, también existe un riesgo más amplio de que un agente pueda alucinar u omitir información clave durante una conversación de múltiples turnos.
Por eso la evaluación sistemática es esencial. A diferencia de un pipeline de ML estático que debe validarse una vez antes del despliegue, este sistema construye dinámicamente un problema de ML distinto para cada pregunta. Necesitamos un marco de evaluación para entender dónde está el límite: qué clases de preguntas producen predicciones fiables y cuáles exceden lo que Genie puede expresar como un conjunto de entrenamiento bien formado.
El acelerador de soluciones incluye un arnés de evaluación completo construido sobre el marco de evaluación GenAI de MLflow. Se ejecuta contra el agente en vivo y registra los resultados en MLflow Experiment Tracking, proporcionando a los equipos un panel único para evaluar y monitorear la calidad a lo largo del tiempo. Puede encontrar todos los detalles aquí.
Video 2. Evaluación de un supervisor multiagente con Genie y TabPFN a través de la interfaz de Databricks Experiments.
Sin este bucle de evaluación, el sistema podría devolver predicciones con confianza, sin forma de distinguir las fiables de las no fiables. Este enfoque riguroso asegura la cobertura en todos los niveles: detecta regresiones conversacionales y de comportamiento, al tiempo que valida la corrección de extremo a extremo del pipeline predictivo. Juntos, estos controles dan a los equipos la confianza para desplegar este patrón en producción, con una comprensión clara de qué clases de preguntas producen predicciones fiables y dónde se encuentran los límites del sistema.
La combinación de Genie, TabPFN y Agent Bricks replantea la relación entre el análisis descriptivo y predictivo. Genie se convierte en la capa de ingeniería de características. TabPFN elimina la sobrecarga de entrenamiento y mantenimiento. Agent Bricks proporciona la columna vertebral de orquestación y gobernanza, mientras que MLflow evalúa y monitorea la calidad de las respuestas. El resultado es que los usuarios de negocio pueden hacer preguntas predictivas en la misma interfaz conversacional que ya utilizan para el análisis descriptivo.
El Acelerador de Soluciones completo está disponible aquí. El repositorio incluye la generación de datos de muestra, la configuración de Genie Space y el arnés de evaluación de extremo a extremo descrito anteriormente. El patrón es agnóstico al dominio: si bien el acelerador demuestra el análisis de ventas empresariales, la misma arquitectura se aplica a cualquier dominio donde existan datos estructurados con resultados, incluyendo la puntuación de riesgo en atención médica, la predicción de calidad en manufactura, la detección de fraude financiero, el análisis de abandono de clientes y más allá.
Comience hoy mismo y lleve la inteligencia predictiva a las conversaciones que sus equipos ya están teniendo.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.