Prädiktive Intelligenz für konversationelle BI mit Genie, TabPFN und Agent Bricks
von Ryuta Yoshimatsu , Javier Poveda Panter, Dominik Safaric, Philipp Singer, Diana Kriuchkova, Sauraj Gambhir, Dael Williamson und Bryan Smith
Business intelligence hat schon immer Fragen beantwortet. Für die meisten Organisationen waren diese Fragen beschreibend – was ist im letzten Quartal passiert? – oder diagnostisch – warum stieg die Abwanderung im Südosten? Databricks Genie hat diese Fragen radikal zugänglicher gemacht und es Geschäftsbenutzern ermöglicht, Antworten in natürlicher Sprache zu erhalten, ohne SQL schreiben oder auf einen Analysten warten zu müssen.
Aber die Fragen, die die folgenschwersten Entscheidungen beeinflussen, sind prädiktiv. Welche Kunden werden wahrscheinlich im nächsten Quartal abwandern? Wie wird sich die Nachfrage verschieben, wenn wir die Preise anpassen? Wie wahrscheinlich ist es, dass dieser Kreditantragsteller ausfällt? Die Beantwortung dieser Fragen erforderte historisch einen völlig anderen Satz von Werkzeugen, Fähigkeiten und Teams – ein Data Scientist, der die Daten untersucht, deren Eignung für Vorhersagen validiert, Features entwickelt, ein Modell trainiert und dieses Modell pflegt, wenn sich die Bedingungen ändern. Das Ergebnis: eine harte Grenze zwischen der BI-Welt, in der Geschäftsbenutzer mit Zuversicht agieren, und der Welt der prädiktiven Analysen, in der nur spezialisierte Teams tätig sein können.
In einem früheren Blogbeitrag haben wir gezeigt, wie TabPFN – ein Foundation Model für tabellarische Daten von Prior Labs – einen Großteil dieses prädiktiven Workflows zusammenfasst, indem es produktionsreife Vorhersagen in einem einzigen Forward Pass liefert. Aber ein wichtiger Engpass blieb bestehen: Jemand musste immer noch die Geschäftsfrage in einen gut formulierten Datensatz übersetzen, bevor TabPFN eine Vorhersage treffen konnte. Das Modell mag sofort sein, aber die Arbeit, die es speist, ist es nicht.
Hier verschiebt sich die Rolle von Genie von der Beantwortung von Fragen zur Ermöglichung von Vorhersagen. Genie versteht bereits die Daten eines Unternehmens – seine Schemata, Beziehungen und Geschäftssemantik. Durch die Kombination von Genie mit TabPFN innerhalb eines Multi-Agenten-Orchestrators erstellen wir einen geschlossenen Kreislauf: Genie übersetzt dynamisch eine Frage in natürlicher Sprache in die präzisen Eingabedaten, die TabPFN benötigt, und TabPFN transformiert diese Daten in einer einzigen Vorwärtsprüfung in eine Vorhersage. Jede prädiktive Frage, die während des Gesprächs gestellt wurde, erhielt eine maßgeschneiderte Antwort im Handumdrehen. Der Raum der Fragen, die Sie beantworten können, wird im Wesentlichen unbegrenzt – jede Frage, die als "Gegeben historische Daten mit einem Ergebnis, prognostizieren Sie ein Ergebnis für ein neues Szenario" formuliert werden kann, kann in Sekunden beantwortet werden.
Das Ergebnis ist eine einzige, gesteuerte Erfahrung – basierend auf Lakehouse-Daten mit vollständiger Abstammung und Zugriffskontrolle über Unity Catalog –, bei der Geschäftsbenutzer prädiktive Fragen in derselben Konversationsschnittstelle stellen, die sie für beschreibende Analysen verwenden.
In diesem Beitrag erläutern wir die Anwendungsarchitektur, die dies ermöglicht, stellen jede technische Komponente vor und zeigen, wie sie zusammenwirken, um prädiktive Intelligenz direkt in der konversationellen BI bereitzustellen.
Video 1. Interaktion mit einem Multi-Agenten-Supervisor mit Genie und TabPFN über eine Databricks Apps-Oberfläche
Das System ist als Multi-Agenten-Orchestrator aufgebaut, der als Databricks App bereitgestellt wird und die Hauptkomponenten über Agent Bricks, eine Plattform zum Erstellen und Bereitstellen von Enterprise Agents auf Databricks, verbindet. Genie fungiert als Subagent für die strukturierte SQL-Analyse über gesteuerte Lakehouse-Daten. TabPFN ist als externer MCP-Server mit Unity Catalog verbunden. Das System unterstützt auch zusätzliche Subagenten und Serving-Endpunkte; andere Databricks-Anwendungen oder zusätzliche MCP-Server können nach Bedarf hinzugefügt werden.
Wenn eine prädiktive Frage eingeht, führt der Orchestrator einen agentenbasierten Workflow aus. Er interpretiert die Geschäftsabsicht des Benutzers. Wenn die Beantwortung der Frage eine prädiktive Analyse erfordert, fragt er Genie auf, um die entsprechenden gekennzeichneten Daten aus dem Lakehouse zu extrahieren. Nachdem alle notwendigen Daten gesammelt wurden, ruft er TabPFN auf und übergibt diese Daten im richtigen Format an das Modell. Schließlich interpretiert der Supervisor die Vorhersagen und liefert dem Benutzer eine umsetzbare Empfehlung (Abbildung 1).

Um dies konkret zu machen, betrachten wir, was passiert, wenn ein Vertriebsleiter fragt: "Welche Art von Promotion würde den Horton-Cross-Deal am wahrscheinlichsten abschließen?"
In einem traditionellen Workflow erfordert die Beantwortung dieser Frage, dass ein Data Scientist die Frage versteht und identifiziert, welche Tabellen und Spalten wichtig sind; den richtigen Trainingsdatensatz aus historischen Deals extrahiert, die Promotion-Typen und Gewinn-/Verlust-Ergebnisse enthalten; einen Algorithmus auswählt, Hyperparameter abstimmt und die Leistung validiert; spezifische Inferenzdaten für den Horton-Cross-Deal vorbereitet; das Modell ausführt und die Ausgabe in eine Geschäftsempfehlung übersetzt. Jeder dieser Schritte erfordert Zeit, Fachwissen und Iteration. Und die nächste Frage – "Was ist das optimale Datum für die Nachverfolgung, um die Gewinnwahrscheinlichkeit zu maximieren?" – erfordert ein völlig anderes Modell, das von Grund auf neu erstellt wird.
Betrachten wir nun, was mit Genie und TabPFN unter demselben Multi-Agenten-Supervisor passiert. Der Supervisor interpretiert die Frage in natürlicher Sprache und ihre semantische Absicht und übersetzt diese Absicht dann in eine spezifische Anfrage an Genie, um einen Datensatz zu generieren. Genie erkennt, dass die Beantwortung dieser Frage historische Chancen erfordert, die mit Promotionen und Konten verknüpft sind, wobei Gewinn oder Verlust als Label verwendet werden, und generiert sofort präzisen SQL-Code, um diese Daten zu extrahieren.
TabPFN empfängt diesen Datensatz und generiert Vorhersagen in einem einzigen Forward Pass – keine Feature-Vorverarbeitung, keine Modellauswahl, keine Hyperparameter-Abstimmung. Schließlich interpretiert der Supervisor die Vorhersagen und gibt eine klare, datengesteuerte Empfehlung zurück. Die gesamte Pipeline – von der Frage bis zur Vorhersage – setzt sich in einem einzigen Gesprächsverlauf aus natürlicher Sprache zusammen.
Das Muster hat Einschränkungen: TabPFN ist nur so gut wie die Daten, die Genie produziert. Wenn Genie für eine gegebene Frage keinen aussagekräftigen Datensatz mit einer klaren Label-Spalte erstellen kann, weil das Schema nicht das richtige Signal erfasst, die notwendigen Joins nicht vorhanden sind oder das Ergebnis nicht in den Daten dargestellt ist, dann ist die Vorhersage nicht zuverlässig, unabhängig davon, wie leistungsfähig TabPFN ist. Die Best Practices für den Aufbau eines effektiven Genie-Bereichs finden Sie hier. Darüber hinaus besteht auch das allgemeinere Risiko, dass ein Agent während eines Multi-Turn-Gesprächs halluzinieren oder wichtige Informationen auslassen kann.
Genau deshalb ist eine systematische Bewertung unerlässlich. Im Gegensatz zu einer statischen ML-Pipeline, die vor der Bereitstellung einmal validiert werden muss, konstruiert dieses System dynamisch ein eigenes ML-Problem für jede Frage. Wir benötigen ein Bewertungsframework, um zu verstehen, wo die Grenze liegt: welche Klassen von Fragen zuverlässige Vorhersagen liefern und welche das übersteigen, was Genie als gut formulierten Trainingsdatensatz ausdrücken kann.
Der Solution Accelerator wird mit einem umfassenden Bewertungs-Harness geliefert, das auf dem GenAI-Bewertungsframework von MLflow basiert. Es läuft gegen den Live-Agenten und protokolliert die Ergebnisse im MLflow Experiment Tracking, wodurch Teams ein einziges Fenster zur Bewertung und Überwachung der Qualität im Laufe der Zeit erhalten. Die vollständigen Details finden Sie hier.
Video 2. Bewertung eines Multi-Agenten-Supervisors mit Genie und TabPFN über die Databricks Experiments-Oberfläche.
Ohne diese Bewertungs-Schleife kann das System zuversichtlich Vorhersagen liefern, ohne dass man vertrauenswürdige von unzuverlässigen unterscheiden kann. Dieser rigorose Ansatz gewährleistet die Abdeckung auf jeder Ebene: Er erfasst konversationelle und verhaltensbezogene Regressionen und validiert gleichzeitig die End-to-End-Korrektheit der prädiktiven Pipeline. Zusammen geben diese Prüfungen den Teams das Vertrauen, dieses Muster in der Produktion einzusetzen, mit einem klaren Verständnis dafür, welche Frageklassen zuverlässige Vorhersagen liefern und wo die Systemgrenzen liegen.
Die Kombination aus Genie, TabPFN und Agent Bricks gestaltet die Beziehung zwischen deskriptiver und prädiktiver Analytik neu. Genie wird zur Feature-Engineering-Schicht. TabPFN eliminiert den Aufwand für Training und Wartung. Agent Bricks stellt das Rückgrat für Orchestrierung und Governance bereit, während MLflow die Qualität der Antworten bewertet und überwacht. Das Ergebnis ist, dass Geschäftsbenutzer prädiktive Fragen in derselben Konversationsoberfläche stellen können, die sie bereits für deskriptive Analysen verwenden.
Der vollständige Solution Accelerator ist hier verfügbar. Das Repository enthält die Generierung von Beispieldaten, die Konfiguration von Genie Space und das oben beschriebene End-to-End-Evaluierungs-Framework. Das Muster ist domänenunabhängig: Während der Accelerator Unternehmensvertriebsanalysen demonstriert, gilt dieselbe Architektur für jeden Bereich, in dem strukturierte Daten mit Ergebnissen vorhanden sind, einschließlich der Risikobewertung im Gesundheitswesen, der Vorhersage der Fertigungsqualität, der Erkennung von Finanzbetrug, der Analyse von Kundenabwanderung und vielem mehr.
Beginnen Sie noch heute und bringen Sie prädiktive Intelligenz in die Gespräche, die Ihre Teams bereits führen.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.