Prädiktive Intelligenz für Conversational BI mit Genie, TabPFN und Agent Bricks
von Ryuta Yoshimatsu , Javier Poveda Panter, Dominik Safaric, Philipp Singer, Diana Kriuchkova, Sauraj Gambhir, Dael Williamson und Bryan Smith
Bei Business Intelligence ging es schon immer darum, Fragen zu beantworten. Für die meisten Unternehmen waren diese Fragen deskriptiv – Was ist im letzten Quartal passiert? – oder diagnostisch – Warum ist die Abwanderungsrate im Südosten sprunghaft angestiegen? Databricks Genie hat den Zugang zu diesen Fragen grundlegend erleichtert. Geschäftsanwender können Antworten in natürlicher Sprache erhalten, ohne SQL schreiben oder auf einen Analysten warten zu müssen.
Doch die Fragen, die die weitreichendsten Entscheidungen beeinflussen, sind prädiktiver Natur. Welche Kunden werden im nächsten Quartal wahrscheinlich abwandern? Wie verschiebt sich die Nachfrage, wenn wir die Preise anpassen? Wie hoch ist die Wahrscheinlichkeit, dass dieser Kreditantragsteller ausfällt? Die Beantwortung dieser Fragen erforderte in der Vergangenheit völlig andere Tools, Fähigkeiten und Teams – einen Data Scientist, der die Daten untersucht, ihre Eignung für Vorhersagen validiert, Features entwickelt, ein Modell trainiert und dieses Modell bei veränderten Bedingungen pflegt. Das Ergebnis: eine harte Grenze zwischen der BI-Welt, in der sich Geschäftsanwender sicher bewegen, und der Welt der prädiktiven Analysen, die nur spezialisierten Teams vorbehalten ist.
In einem früheren Blogbeitrag haben wir gezeigt, wie TabPFN – ein Foundation-Modell für tabellarische Daten von Prior Labs – einen Großteil dieses prädiktiven Workflows verkürzt, indem es produktionsreife Vorhersagen in einem einzigen Forward Pass liefert. Doch ein entscheidender Engpass blieb bestehen: Jemand musste die geschäftliche Fragestellung immer noch in einen gut strukturierten Datensatz übersetzen, bevor TabPFN eine Vorhersage treffen konnte. Das Modell mag blitzschnell sein, die vorbereitende Arbeit ist es jedoch nicht.
Hier wandelt sich die Rolle von Genie: von der Beantwortung von Fragen hin zur Ermöglichung von Vorhersagen. Genie versteht bereits die Daten eines Unternehmens – ihre Schemata, Beziehungen und die geschäftliche Semantik. Durch die Kombination von Genie mit TabPFN in einem Multi-Agenten-Orchestrator schaffen wir einen geschlossenen Kreislauf: Genie übersetzt eine Frage in natürlicher Sprache dynamisch in genau die Eingabedaten, die TabPFN benötigt, und TabPFN wandelt diese Daten in einem einzigen Forward Pass in eine Vorhersage um. Jede prädiktive Frage, die während des Gesprächs gestellt wurde, erhielt direkt eine maßgeschneiderte Antwort. Der Raum der beantwortbaren Fragen wird praktisch unbegrenzt – jede Frage, die sich als „prognostiziere auf Basis historischer Daten mit bekanntem Ergebnis das Ergebnis für ein neues Szenario“ formulieren lässt, kann in Sekundenschnelle beantwortet werden.
Das Ergebnis ist eine einzige, kontrollierte Umgebung – basierend auf Lakehouse-Daten mit vollständiger Lineage und Zugriffskontrolle durch Unity Catalog –, in der Geschäftsanwender prädiktive Fragen über dieselbe Chat-Schnittstelle stellen können, die sie auch für deskriptive Analysen nutzen.
In diesem Beitrag führen wir Sie durch die Anwendungsarchitektur, die dies ermöglicht. Wir stellen die einzelnen technischen Komponenten vor und zeigen, wie sie zusammenwirken, um prädiktive Intelligenz direkt in der konversationellen BI bereitzustellen.
Video 1. Interaktion mit einem Multi-Agent-Supervisor mit Genie und TabPFN über eine Databricks Apps-Schnittstelle
Das System ist als Multi-Agenten-Orchestrator aufgebaut, der als Databricks App bereitgestellt wird. Er verbindet die Hauptkomponenten über Agent Bricks, eine Plattform zum Erstellen und Bereitstellen von Enterprise-Agenten auf Databricks. Genie fungiert als Subagent für strukturierte SQL-Analysen über kontrollierte Lakehouse-Daten. TabPFN ist als externer MCP-Server mit Unity Catalog verbunden. Das System unterstützt auch zusätzliche Subagenten und Serving-Endpoints; andere Databricks-Anwendungen oder zusätzliche MCP-Server können bei Bedarf hinzugefügt werden.
Wenn eine prädiktive Frage eingeht, führt der Orchestrator einen agentenbasierten Workflow aus. Er interpretiert die geschäftliche Absicht des Benutzers. Erfordert die Beantwortung der Frage eine prädiktive Analyse, fragt er Genie ab, um die entsprechenden gelabelten Daten aus dem Lakehouse zu extrahieren. Sobald alle erforderlichen Daten erfasst sind, ruft er TabPFN auf und übergibt diese Daten im richtigen Format an das Modell. Schließlich interpretiert der Supervisor die Vorhersagen und liefert dem Benutzer eine konkrete Handlungsempfehlung (Abbildung 1).

Um dies zu verdeutlichen, stellen Sie sich vor, was passiert, wenn ein Vertriebsleiter fragt: „Welche Art von Werbeaktion würde den Horton-Cross-Deal am wahrscheinlichsten abschließen?“
In einem herkömmlichen Workflow erfordert die Beantwortung dieser Frage, dass ein Data Scientist die Frage versteht und identifiziert, welche Tabellen und Spalten relevant sind; den richtigen Trainingsdatensatz aus historischen Deals extrahiert, der Werbeaktionen und Gewinn-/Verlust-Ergebnisse enthält; einen Algorithmus auswählt, Hyperparameter optimiert und die Leistung validiert; spezifische Inferenzdaten für den Horton-Cross-Deal vorbereitet; das Modell ausführt und die Ausgabe in eine geschäftliche Empfehlung übersetzt. Jeder dieser Schritte erfordert Zeit, Fachwissen und Iterationen. Und die nächste Frage – „Was ist das optimale Datum für ein Follow-up, um die Gewinnwahrscheinlichkeit zu maximieren?“ – erfordert ein völlig neues, von Grund auf neu entwickeltes Modell.
Sehen wir uns nun an, was mit Genie und TabPFN unter demselben Multi-Agent-Supervisor passiert. Der Supervisor interpretiert die Frage in natürlicher Sprache und ihre semantische Absicht und übersetzt diese Absicht dann in eine spezifische Anfrage an Genie zur Erstellung eines Datensatzes. Genie erkennt, dass die Beantwortung dieser Frage historische Opportunities verknüpft mit Werbeaktionen und Accounts erfordert, wobei Gewinn oder Verlust als Label dient, und generiert sofort präzises SQL, um diese Daten zu extrahieren.
TabPFN empfängt diesen Datensatz und generiert Vorhersagen in einem einzigen Forward Pass – ohne Feature-Vorverarbeitung, ohne Modellselektion, ohne Hyperparameter-Tuning. Schließlich liefert der Supervisor eine klare, datengestützte Empfehlung. Die gesamte Pipeline – von der Frage bis zur Vorhersage – baut sich in einem einzigen Gesprächsschritt aus natürlicher Sprache selbst auf.
Dieses Muster hat Grenzen: TabPFN ist nur so gut wie die von Genie bereitgestellten Daten. Wenn Genie für eine bestimmte Frage keinen aussagekräftigen Datensatz mit einer eindeutigen Label-Spalte erstellen kann – weil das Schema nicht die richtigen Signale erfasst, die erforderlichen Joins nicht existieren oder das Ergebnis nicht in den Daten enthalten ist –, dann ist die Vorhersage unzuverlässig, unabhängig davon, wie leistungsfähig TabPFN ist. Die Best Practices für die Erstellung eines effektiven Genie-Space finden Sie hier. Darüber hinaus besteht das allgemeine Risiko, dass ein Agent während einer Konversation über mehrere Runden hinweg halluziniert oder wichtige Informationen auslässt.
Genau aus diesem Grund ist eine systematische Evaluierung unerlässlich. Im Gegensatz zu einer statischen ML-Pipeline, die vor der Bereitstellung einmal validiert werden muss, konstruiert dieses System für jede Frage dynamisch ein eigenes ML-Problem. Wir benötigen ein Evaluierungs-Framework, um zu verstehen, wo die Grenzen liegen: Welche Arten von Fragen liefern zuverlässige Vorhersagen und welche überschreiten das, was Genie als gut strukturierten Trainingsdatensatz darstellen kann.
Der Solution Accelerator wird mit einem umfassenden Evaluierungs-Harness geliefert, das auf dem GenAI-Evaluierungs-Framework von MLflow aufbaut. Es läuft direkt auf dem Live-Agenten und protokolliert die Ergebnisse im MLflow Experiment Tracking. So erhalten Teams eine zentrale Oberfläche, um die Qualität im Laufe der Zeit zu bewerten und zu überwachen. Die vollständigen Details finden Sie hier.
Video 2. Evaluierung eines Multi-Agent-Supervisors mit Genie und TabPFN über die Databricks Experiments-Schnittstelle.
Ohne diese Evaluierungsschleife liefert das System unter Umständen selbstbewusst Vorhersagen, ohne dass sich vertrauenswürdige von unzuverlässigen unterscheiden lassen. Dieser strenge Ansatz stellt die Abdeckung auf allen Ebenen sicher: Er fängt konversationelle und verhaltensbezogene Regressionen ab und validiert gleichzeitig die End-to-End-Korrektheit der prädiktiven Pipeline. Zusammen geben diese Prüfungen Teams die Sicherheit, dieses Muster in der Produktion einzusetzen – mit einem klaren Verständnis dafür, welche Fragenklassen zuverlässige Vorhersagen liefern und wo die Grenzen des Systems liegen.
Die Kombination aus Genie, TabPFN und Agent Bricks definiert die Beziehung zwischen deskriptiver und prädiktiver Analytik neu. Genie wird zur Feature-Engineering-Ebene. TabPFN eliminiert den Trainings- und Wartungsaufwand. Agent Bricks bildet das Rückgrat für Orchestrierung und Governance, während MLflow die Qualität der Antworten evaluiert und überwacht. Das Ergebnis ist, dass Geschäftsanwender prädiktive Fragen in derselben Konversationsschnittstelle stellen können, die sie bereits für deskriptive Analysen nutzen.
Der vollständige Solution Accelerator ist hier verfügbar. Das Repository umfasst die Generierung von Beispieldaten, die Konfiguration des Genie Space und die oben beschriebene End-to-End-Evaluierungsumgebung. Das Muster ist domänenunabhängig: Während der Accelerator Vertriebsanalysen für Unternehmen demonstriert, lässt sich dieselbe Architektur auf jeden Bereich anwenden, in dem strukturierte Daten mit Ergebnissen vorliegen – einschließlich Risikobewertung im Gesundheitswesen, Qualitätsvorhersage in der Fertigung, Erkennung von Finanzbetrug, Kundenabwanderungsanalyse und darüber hinaus.
Legen Sie noch heute los und bringen Sie prädiktive Intelligenz in die Unterhaltungen, die Ihre Teams bereits führen.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.