Ir para o conteúdo principal
Produto

De \"O Que Aconteceu?\" para \"O Que Acontecerá?\"

Trazendo Inteligência Preditiva para BI Conversacional com Genie, TabPFN e Agent Bricks

por Ryuta Yoshimatsu , Javier Poveda Panter, Dominik Safaric, Philipp Singer, Diana Kriuchkova, Sauraj Gambhir, Dael Williamson e Bryan Smith

  • Esta arquitetura combina Genie como uma camada dinâmica de engenharia de recursos com TabPFN como um modelo de previsão sem treinamento, orquestrado via Agent Bricks — entregando respostas preditivas diretamente na BI conversacional.
  • Sem mais gargalos. Usuários de negócios não precisam mais esperar pelas equipes de ciência de dados para identificar tabelas, extrair dados de treinamento, selecionar um modelo e interpretar resultados. O pipeline se auto-monta a partir de uma pergunta em linguagem natural.
  • O resultado: uma experiência única e governada — apoiada pela linhagem do Unity Catalog e avaliação do MLflow — onde qualquer pergunta formulada como "dados resultados históricos, preveja um novo" é resolvida em segundos, não em dias.

A inteligência de negócios sempre foi sobre responder a perguntas. Para a maioria das organizações, essas perguntas têm sido descritivas — o que aconteceu no último trimestre? — ou diagnósticas — por que a rotatividade aumentou no Sudeste? Databricks Genie tornou essas perguntas radicalmente mais acessíveis, permitindo que usuários de negócios obtenham respostas em linguagem natural sem escrever SQL ou esperar por um analista.

Mas as perguntas que impulsionam as decisões mais importantes são preditivas. Quais clientes provavelmente terão rotatividade no próximo trimestre? Como a demanda mudará se ajustarmos os preços? Qual a probabilidade de este solicitante de empréstimo entrar em inadimplência? Responder a essas perguntas historicamente exigiu um conjunto totalmente diferente de ferramentas, habilidades e equipes — um cientista de dados explorando os dados, validando sua adequação para previsão, engenharia de recursos, treinamento de um modelo e manutenção desse modelo conforme as condições mudam. O resultado: uma fronteira rígida entre o mundo da BI, onde os usuários de negócios operam com confiança, e o mundo da análise preditiva, onde apenas equipes especializadas podem atuar.

Em um post anterior do blog, mostramos como o TabPFN — um modelo de base para dados tabulares da Prior Labs — simplifica grande parte desse fluxo de trabalho preditivo, entregando previsões de nível de produção em uma única passagem direta. Mas um gargalo fundamental permaneceu: alguém ainda precisava traduzir a pergunta de negócios em um conjunto de dados bem formado antes que o TabPFN pudesse fazer uma previsão. O modelo pode ser instantâneo, mas o trabalho que o alimenta não é.

Genie como Engenheiro de Recursos, TabPFN como Modelo Universal

É aqui que o papel do Genie muda de responder a perguntas para possibilitar previsões. O Genie já entende os dados de uma organização — seus esquemas, relacionamentos e semântica de negócios. Ao combinar o Genie com o TabPFN dentro de um orquestrador multiagente, criamos um ciclo fechado: o Genie traduz dinamicamente uma pergunta em linguagem natural nos dados de entrada precisos que o TabPFN precisa, e o TabPFN transforma esses dados em uma previsão em uma única passagem direta. Cada pergunta preditiva feita durante a conversa recebeu uma resposta personalizada na hora. O espaço de perguntas que você pode responder torna-se essencialmente ilimitado — qualquer pergunta que possa ser formulada como "dados históricos com um resultado, preveja um resultado para um novo cenário" pode ser respondida em segundos.

O resultado é uma experiência única e governada — baseada em dados do Lakehouse com linhagem completa e controle de acesso através do Unity Catalog — onde os usuários de negócios fazem perguntas preditivas na mesma interface conversacional que usam para análises descritivas.

Neste post, detalhamos a arquitetura da aplicação que torna isso possível, apresentando cada componente técnico e mostrando como eles se unem para entregar inteligência preditiva diretamente dentro da BI conversacional.

Vídeo 1. Interagindo com um supervisor multiagente com Genie e TabPFN via uma interface de Databricks Apps

Arquitetura: Um Supervisor Multiagente

O sistema é construído como um orquestrador multiagente implantado como um Databricks App, que conecta os componentes primários usando Agent Bricks, uma plataforma para construir e implantar agentes empresariais no Databricks. O Genie atua como um subagente para análises SQL estruturadas sobre dados governados do Lakehouse. O TabPFN está conectado ao Unity Catalog como um servidor MCP externo. O sistema também suporta subagentes adicionais e endpoints de serviço; outros aplicativos Databricks, ou servidores MCP adicionais, podem ser adicionados conforme necessário.

Quando uma pergunta preditiva chega, o orquestrador executa um fluxo de trabalho agêntico. Ele interpreta a intenção de negócios do usuário. Se responder à pergunta exigir análise preditiva, ele consulta o Genie para extrair os dados rotulados apropriados do Lakehouse. Depois de coletar todos os dados necessários, ele chama o TabPFN, passando esses dados para o modelo no formato correto. Finalmente, o supervisor interpreta as previsões e entrega uma recomendação acionável ao usuário (Figura 1).

Arquitetura de supervisor multiagente
">

A Ideia Central em Ação

Para tornar isso concreto, considere o que acontece quando um líder de vendas pergunta: "Qual tipo de promoção teria maior probabilidade de fechar o negócio Horton-Cross?"

Em um fluxo de trabalho tradicional, responder a essa pergunta exige que um cientista de dados entenda a pergunta e identifique quais tabelas e colunas são relevantes; extraia o conjunto de treinamento correto de negócios históricos que incluem tipos de promoção e resultados de vitória/perda; selecione um algoritmo, ajuste hiperparâmetros e valide o desempenho; prepare dados de inferência específicos para o negócio Horton-Cross; execute o modelo; e traduza a saída em uma recomendação de negócios. Cada uma dessas etapas exige tempo, experiência e iteração. E a próxima pergunta — "Qual é a data ideal para fazer o acompanhamento para maximizar a probabilidade de vitória?" — exige um modelo totalmente diferente, construído do zero.

Agora, considere o que acontece com o Genie e o TabPFN sob o mesmo supervisor multiagente. O supervisor interpreta a pergunta em linguagem natural e sua intenção semântica, então traduz essa intenção em uma solicitação específica para o Genie gerar um conjunto de dados. O Genie reconhece que responder a essa pergunta exige oportunidades históricas unidas a promoções e contas, usando vitória ou perda como rótulo, e gera SQL preciso para extrair esses dados instantaneamente.

O TabPFN recebe esse conjunto de dados e gera previsões em uma única passagem direta — sem pré-processamento de recursos, sem seleção de modelo, sem ajuste de hiperparâmetros. Finalmente, o supervisor retorna uma recomendação clara e baseada em dados. Todo o pipeline — da pergunta à previsão — se monta a partir da linguagem natural em uma única rodada de conversa.

Avaliando Qualidade e Limitações

O padrão tem limitações: o TabPFN é tão bom quanto os dados que o Genie produz. Se o Genie não conseguir construir um conjunto de dados significativo com uma coluna de rótulo clara para uma determinada pergunta, porque o esquema não captura o sinal correto, as junções necessárias não existem, ou o resultado não está representado nos dados, então a previsão não será confiável, independentemente da capacidade do TabPFN. Veja as melhores práticas para construir um espaço Genie eficaz aqui. Além disso, há também um risco maior de que um agente possa alucinar ou omitir informações importantes durante uma conversa multi-turno.

É exatamente por isso que a avaliação sistemática é essencial. Ao contrário de um pipeline de ML estático que deve ser validado uma vez antes da implantação, este sistema constrói dinamicamente um problema de ML distinto para cada pergunta. Precisamos de uma estrutura de avaliação para entender onde está o limite: quais classes de perguntas produzem previsões confiáveis e quais excedem o que o Genie pode expressar como um conjunto de treinamento bem formado.

O acelerador de solução vem com um conjunto abrangente de avaliação construído sobre a estrutura de avaliação GenAI do MLflow. Ele é executado contra o agente ativo e registra os resultados no MLflow Experiment Tracking, oferecendo às equipes uma visão unificada para avaliar e monitorar a qualidade ao longo do tempo. Você pode encontrar todos os detalhes aqui.

Vídeo 2. Avaliando um supervisor multiagente com Genie e TabPFN via interface de Databricks Experiments.

Sem este ciclo de avaliação, o sistema pode retornar previsões com confiança, mas sem uma maneira de distinguir as confiáveis das não confiáveis. Essa abordagem rigorosa garante cobertura em todos os níveis: ela detecta regressões conversacionais e comportamentais, ao mesmo tempo em que valida a correção de ponta a ponta do pipeline preditivo. Juntos, esses verificações dão às equipes a confiança para implantar este padrão em produção, com uma compreensão clara de quais classes de perguntas produzem previsões confiáveis e onde estão os limites do sistema.

Comece Agora

A combinação de Genie, TabPFN e Agent Bricks redefine a relação entre análise descritiva e preditiva. Genie se torna a camada de engenharia de recursos (feature engineering). TabPFN elimina a sobrecarga de treinamento e manutenção. Agent Bricks fornece a espinha dorsal de orquestração e governança, enquanto MLflow avalia e monitora a qualidade das respostas. O resultado é que os usuários de negócios podem fazer perguntas preditivas na mesma interface conversacional que já usam para análise descritiva.

O Acelerador de Soluções completo está disponível aqui. O repositório inclui geração de dados de amostra, configuração do Genie Space e o sistema de avaliação de ponta a ponta descrito acima. O padrão é agnóstico ao domínio: embora o acelerador demonstre análise de vendas empresariais, a mesma arquitetura se aplica a qualquer domínio onde existam dados estruturados com resultados, incluindo pontuação de risco em saúde, previsão de qualidade na manufatura, detecção de fraude financeira, análise de rotatividade de clientes e muito mais.

Comece hoje mesmo e traga inteligência preditiva para as conversas que suas equipes já estão tendo.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.