Ein Gespräch mit Ari Kaplan, Head of Technical Evangelism bei Databricks, über konversationsbasierte Analysen, moderne Datenbanken und warum der Abstand zwischen Vorreitern und Nachzüglern schnell schrumpft.
von Catherine Brown
Eine Frage, die derzeit in Vorständen und bei Treffen von Datenverantwortlichen kursiert, lautet etwa so: "Wir haben bereits BI. Wir haben bereits eine Datenbanklösung. Warum brauchen wir also etwas anderes?"
Das ist eine berechtigte Frage. Und eine, die Ari Kaplan auf fünf Kontinenten beantwortet hat. Als Global Head of Evangelism bei Databricks hat Ari seine Karriere an der Schnittstelle von Daten, Technologie und Geschäftstransformation verbracht, einschließlich einer Amtszeit als Präsident der Independent Oracle Users Group, einer Organisation, die mehr als 22.000 Datenbankexperten vertritt. Er hat aus erster Hand erfahren, was funktioniert, was schlecht altert und was das nächste Jahrzehnt erfordert.
In diesem Gespräch befassen wir uns mit konversationeller Analytik, der Architektur hinter Genie und Lakebase, was es tatsächlich braucht, um das Vertrauen von Führungskräften in KI-gesteuerte Erkenntnisse zu gewinnen, und warum Unternehmen, die nicht handeln, möglicherweise weiter zurückliegen, als sie denken.
Erkenntnis ohne Handeln ist nur Trivia
Catherine Brown: Ari, Führungskräfte lieben die Idee, mit ihren Daten zu sprechen, aber wo liegt der Knackpunkt bei der konversationellen Analytik?
Ari Kaplan: Absolut! Im Grunde wollen Unternehmen mit ihren Daten sprechen, die im Kontext ihres eigenen Geschäfts verwaltet werden. Aber hier scheitert es: Wenn Sie nur Fakten – im Wesentlichen Trivia – erhalten und es keinen Weg zur Handlung gibt, welchen Sinn hat das dann? Der Wert jeder Erkenntnis ist nur so real wie das, was daraus resultiert.
Das ist der Unterschied, den Databricks machen will. Es ist nicht nur ein Gespräch, sondern es führt zu etwas. Ich sprach mit Etihad Airlines, einem unserer größten Genie-Nutzer. Ihr Finanzteam stellte Fragen wie: "Wenn die Ölpreise im nächsten Quartal steigen, wie passen wir unsere Preise an, damit wir immer noch Geld verdienen und Kunden immer noch fliegen wollen?" Solche Analysen dauerten früher Monate, aber mit Genie und prädiktiver Analytik führen sie diese Szenarien in Echtzeit durch und treffen fast sofort die Entscheidung, Preise und Routen zu ändern. Das ist ein großartiges Beispiel dafür, wie ein Unternehmen auf der Grundlage seiner Daten geführt wird und nicht nur von ihnen informiert wird.
Catherine: Wann muss eine Antwort in natürlicher Sprache zu etwas mehr werden, wie einem Workflow, einer Transaktion oder einer tatsächlichen Entscheidung?
Ari: Es sollte sofort geschehen, wenn es von Bedeutung sein soll. Ein Bericht, der einfach da liegt und auf den niemand reagiert, ist nur Lärm. Das Ziel ist es, von der Erkenntnis zur Handlung zu gelangen, ohne etwas Zerbrechliches zu schaffen.
Sie wollen kein System, bei dem jemand einfach eine KI-Antwort nimmt und blind damit arbeitet. Sie brauchen immer noch einen Menschen in der Schleife. Was Sie wollen, ist Agilität: Daten, die sich ständig aktualisieren, Erkenntnisse, die aktuell bleiben, und Menschen in der Organisation, die die Aufsicht haben, um sicherzustellen, dass alles mit dem tatsächlichen Geschäftsbetrieb verbunden bleibt. Die Menschen sind immer noch die Schnittstelle. Das verschwindet nicht.
Catherine: Was löst Genie für den Business-Anwender, womit Dashboards und BI-Copiloten noch immer Schwierigkeiten haben?
Ari: Okay, Genie geht über traditionelle Business-Intelligence-Tools hinaus, indem es Ihnen ermöglicht, einfach mit Ihren eigenen Daten im Kontext Ihres Geschäfts zu sprechen. Es ermöglicht Benutzern, ihre eigenen KI-gesteuerten Erkenntnisse selbst zu generieren.
Denken Sie darüber nach, was ein Dashboard eigentlich ist. Es ist eine feste Frage, die immer wieder gestellt wird, nur mit neuen Daten. Unternehmen machen das seit fast 30 Jahren. Es funktioniert. Aber es hat eine Grenze. Und diese Grenze ist: Die Frage ändert sich nie.
Genie sprengt diese Grenze, denn jetzt kann eine nicht-technische Person, eine Führungskraft, ein Vertriebsleiter, ein Finanzmanager, einfach in einfacher Sprache fragen, was sie tatsächlich wissen möchte, und eine Antwort erhalten. Es gibt kein Ticket an das BI-Team und kein wochenlanges Warten auf ein Dashboard, das fast richtig ist, aber noch angepasst werden muss. Es ist erwähnenswert, dass das BI-Team nicht verschwindet. Sie können sich auf die wirklich komplexen Dinge konzentrieren, anstatt Anfragen für einmalige Berichte zu bearbeiten. Am Ende ist es für alle eine bessere Situation.
Und „Genie Code“ ermöglicht es technisch versierteren Benutzern, Datenwissenschaftlern, Dateningenieuren und anderen, in ihren Aufgaben und den zu erledigenden Arbeiten wesentlich effektiver und effizienter zu sein.
Catherine: Wie passen Genie und Lakebase zusammen? Denn von außen können sie wie zwei separate Produkte klingen, die möglicherweise interagieren oder auch nicht.
Ari: Genie und Lakebase sind wirklich zwei Hälften derselben Idee. Lakebase ist ein Schlüsselbereich, in dem Ihre Transaktionsdaten leben können. Es ist die moderne Datenbank, die entwickelt wurde, um Milliarden oder sogar Billionen von Datensätzen zu verarbeiten. Lakebase ist nur eine von vielen Quellen, mit denen Genie sich verbindet. Lakehouse (DBSQL) ist eine weitere, ebenso wie alles, was über Unity Catalog föderiert wird: Slack, SAP, Google Drive, Sharepoint, usw.
Genie ist die Art und Weise, wie Sie mit all Ihren Daten sprechen, von Lakebase bis zu Ihren Warehouse-Daten in Lakehouse und darüber hinaus. Eines speichert sie also, das ist Lakebase. Und eines bringt sie an die Oberfläche, das ist Genie. Und das Ganze läuft über Unity Catalog, um Governance-Kontrollen zu verwalten und aufrechtzuerhalten. So sehen die richtigen Personen nur das, was sie sehen sollen, und alle arbeiten mit denselben Definitionen. Über jedes Team und jeden Business-Anwender hinweg sind die Definitionen dieselben: Kunde bedeutet Kunde und Gewinn bedeutet Gewinn. Diese gemeinsame Sprache klingt einfach, aber sie ist tatsächlich das, was das Ganze vertrauenswürdig macht.
Catherine: Hier ist eine lustige Frage: Ein CIO sagt, ich habe bereits eine Datenbank. Erklären Sie, warum das nicht mehr ausreicht.
Ari: Ich liebe diese Frage, weil ich auf der anderen Seite stand. Ich kann Ihnen sagen, dass sich die grundlegende Architektur hinter traditionellen Datenbanken seit Jahrzehnten nicht wirklich verändert hat. Diese Grundlagen wurden für eine andere Ära geschaffen.
Hier ist, was sich geändert hat. Mit Lakebase können Sie eine neue Datenbank sofort bereitstellen – nicht in Tagen oder Wochen. Und die meisten heute erstellten Datenbanken werden von KI bereitgestellt.
Das Zweite sind die Kosten. Traditionell, wenn Sie eine Produktionsumgebung, eine Testumgebung und eine QA-Umgebung benötigten, haben Sie drei Kopien Ihrer Daten erstellt. Dreifacher Speicher, dreifache Kosten. Mit Lakebase können Sie hundert Umgebungen abspalten, ohne eine einzige Kopie der zugrunde liegenden Daten zu erstellen. Ich war gerade in Brasilien, und Unternehmen erzählten mir, dass sie ihre Gesamtbetriebskosten nach dem Umzug um 40% gesenkt haben. Das höchste, was ich gehört habe, sind 98%. Nicht jeder erreicht das, aber die Einsparungen sind überall, wo ich hingehe, real.
Und dann die Skalierung. Arctic Wolf, das größte Netzwerkbetriebszentrum der Welt, verwaltet täglich über eine Billion Datensätze auf Databricks. Die alten Annahmen gelten einfach nicht mehr.
Catherine: Was ist der wirkliche Unterschied zwischen dem Stellen einer Frage an Ihre Daten und dem Führen Ihres Geschäfts auf deren Grundlage?
Ari: Am einfachsten ausgedrückt: Das eine sagt Ihnen, was passiert ist, das andere hilft Ihnen zu entscheiden, was als Nächstes zu tun ist.
Eine internationale Fluggesellschaft, mit der ich zusammenarbeite, hatte 80 Lieferanten – Catering, Sicherheit, Elektronik, alles. Sie fragten Genie: Welcher unserer Lieferanten übervorteilt uns? Ordnen Sie sie. So etwas hätte ein Analystenteam Monate gekostet. Genie hat es beantwortet. Es stellte sich heraus, dass ihr Orangensaftlieferant die größte Übervorteilung war. Jetzt wissen sie genau, wohin sie gehen müssen, um neu zu verhandeln. Das ist es, ein Geschäft auf Datenbasis zu führen.
Supercell – sie entwickeln Spiele mit Hunderten Millionen monatlicher Spieler – nutzt Lakebase für Echtzeit-Matchmaking, Toxizitätskontrollen und In-Game-Kaufentscheidungen. All das geschieht live und in großem Maßstab, weil die Dateninfrastruktur mithalten kann.
Und iFood in Brasilien, das mehr als 90% der Lebensmittellieferungen des Landes abwickelt, nutzt Lakebase, um Motorradfahrer in Echtzeit durch dichte Städte zu leiten. Das sind keine Unternehmen, die darüber nachdenken, ihre Daten irgendwann besser zu nutzen. Sie tun es bereits.
Catherine: Warum sind Semantik und Geschäftsdefinitionen wichtig, damit Führungskräfte konversationeller Analytik vertrauen?
Ari: Ehrlich gesagt, mehr als die meisten Leute erwarten. Hier ist ein einfaches Beispiel. Sie bitten drei Führungskräfte desselben Unternehmens, den Gewinn zu definieren. Sie werden drei verschiedene Antworten erhalten. Dasselbe gilt für die Kundenabwanderung, dasselbe für die Kundenzufriedenheit. Wenn Ihr Analysesystem nicht weiß, welche Definition es verwenden soll, erhalten Sie Antworten, die zu Streit statt zu Übereinstimmung führen.
Databricks gibt Führungskräften die Möglichkeit, diese Begriffe selbst zu definieren, ohne dass Softwareentwicklung erforderlich ist. Eine Führungskraft kann sagen: Für mich zählt ein Verkauf erst, wenn das 30-tägige Rückgabefenster geschlossen ist. Diese Definition ist nun für jeden, der diesen Genie-Bereich nutzt, fest verankert. Sie können sogar Ihr HR-Handbuch oder Betriebshandbuch hochladen, und Unity Catalog wird dies nutzen, um die Sprache Ihres Unternehmens besser zu verstehen.
FordDirect hat so etwas in seinem globalen Händlernetzwerk umgesetzt. An Tausenden von Standorten erhielten sehr nicht-technische Benutzer, Autoverkäufer, tägliche Betriebsberichte über Genie. Berichte, die enthielten, welche Kunden kommen, welche Fahrzeuge eintreffen und welche Autos zurückgerufen werden. Sie führten eine Zufriedenheitsumfrage durch, die eine Zustimmungsrate von 95 % ergab. Für ein nicht-technisches Publikum in diesem Umfang ist diese Zahl fast unerhört.
Catherine: Was läuft schief, wenn konversationelle Analysen nicht mit gesteuerten operativen Systemen verbunden sind?
Ari: Es kommt zu Abweichungen, und Sie verlieren Vertrauen, und wenn Sie einmal Vertrauen verloren haben, ist es sehr schwer, es zurückzugewinnen. Wir haben mehr als 20.000 Kunden befragt, und das größte Hindernis für die Einführung von AI und Daten war ein Mangel an Vertrauen. Nicht Kosten, nicht Komplexität – Vertrauen. Und dieses Misstrauen entsteht durch Systeme, die nicht gesteuert werden, wo verschiedene Teams Dinge unterschiedlich definieren und die Antworten von der Realität abweichen. Halluzinationen sind die dramatische Version davon, aber die leisere Version – leicht veraltete Daten, leicht inkonsistente Definitionen – ist tatsächlich gefährlicher, weil sie schwerer zu erkennen ist.
Catherine: Was muss für Führungskräfte, die sagen, dass die Analyse natürlicher Sprache zu riskant ist, weil sich die Terminologie ständig ändert, zutreffen, bevor sie voranschreiten sollten?
Ari: Sie liegen nicht falsch, das Risiko ist real. Ohne Leitplanken sind Allzweck-Chatbots wirklich riskant, weil sie nicht wissen, ob die Daten, aus denen sie schöpfen, von letzter Woche oder von vor fünf Jahren stammen. Und sie verstehen Ihren Geschäftskontext nicht. Die Antwort ist jedoch nicht zu warten. Die Antwort ist, bewusst vorzugehen, wie Sie es einführen.
Fox Sports ist das Beispiel, auf das ich immer wieder zurückkomme. Ihr Ruf basiert vollständig auf Genauigkeit. Menschen treffen Entscheidungen, manchmal finanzielle, die Wetten und Einsätze beinhalten, basierend auf ihren Inhalten. Sie implementierten einen von Databricks betriebenen öffentlichen Chatbot. Aber sie waren vorsichtig bei der Bereitstellung. Sie definierten im Voraus, was gefragt werden durfte und was nicht. Sie ließen Menschen die Formulierung der Antworten gestalten. Und sie bauten Kontrollen ein, um Halluzinationen zu verhindern. Heute laufen 25 % aller Fragen bei Fox Sports über diese Umgebung. Alles, weil sie zuerst das Fundament richtig gelegt haben.
Catherine: Was übersehen Führungskräfte, die denken, Genie sei nur text-to-SQL mit einer besseren Geschichte?
Ari: Eine Menge, um ehrlich zu sein. Das Grundlegende, was sie übersehen, ist, dass Genie auf ihren Daten, mit ihrer Terminologie und nach ihren Geschäftsregeln aufgebaut ist. Ein generischer Chatbot wurde im Internet trainiert – Taylor Swift-Texte, historische Trivia, was auch immer. Genie weiß, was Ihr Unternehmen meint, wenn es die Begriffe Kunde verwendet, und es kennt Ihr Geschäftsjahr. Es kennt Ihren Produktkatalog. Diese granulare Spezifität ist wichtig. Und Genie geht weit über Frage und Antwort hinaus. Genie führt offene Recherchen durch. Es trifft Vorhersagen. Es verbindet sich mit Ihren angrenzenden Systemen wie Salesforce, Workday, SAP, Slack, sodass Sie Fragen stellen können, die Ihr gesamtes Geschäft umfassen. Ich habe Führungskräfte gesehen, die es verwendet haben, um wirklich offene Fragen zu stellen wie: „Worauf sollte ich mich heute konzentrieren?“ Und diese Führungskräfte gingen mit zwei Ideen weg, die sie noch nie in Betracht gezogen hatten. Das ist nicht text-to-SQL. Das ist etwas ganz anderes.
Catherine: Letzte Frage – 18 Monate, was unterscheidet die Unternehmen, die einen modernen Datenstack operationalisieren, von denen, die noch Demos laufen lassen?
Ari: Ich war tatsächlich Teil der Hintergrundgeschichte des Films „Moneyball“, der sich darum drehte, wie sich eine Branche (Major League Baseball) ändern musste. Die Teams, die sich nicht anpassten, wurden dramatisch und schnell abgehängt. Der Satz aus dieser Geschichte war „anpassen oder sterben“. Es klingt extrem, aber ich komme immer wieder darauf zurück.
Ich war allein in den letzten Monaten in Brasilien, Australien, Indien, quer durch Europa und Asien. Überall, wo ich hingehe, bewegen sich Unternehmen schnell. Diejenigen, die es jetzt ernst meinen, ziehen davon. Und die Lücke wird nicht klein bleiben – sie wird sich vergrößern. Der Wert ist real. Unternehmen erhalten bessere Einblicke, ja, aber sie automatisieren auch Arbeiten, die früher ganze Teams in Anspruch nahmen, transformieren Lieferketten und beschleunigen die Softwareentwicklung. All das ist jetzt verfügbar. Die Führungskräfte, die dies als etwas betrachten, das später bewertet werden soll, werden feststellen, dass „später“ früher kam, als sie erwartet.
Der Datenstack hat sich geändert. Die Frage ist, ob Sie es auch getan haben.
Das Besondere an Aris Argument ist: Es geht nicht wirklich um Produkte. Es geht um eine Verschiebung dessen, was möglich ist und wie schnell es zur grundlegenden Erwartung wird.
Genie und Lakebase sind kein BI-Tool und keine Datenbank, die zufällig auf derselben Plattform existieren. Sie sind eine einzige Antwort auf eine Frage, die jeder Datenverantwortliche gerade gestellt bekommt: Wie bringen wir unsere Daten dazu, tatsächlich für die Menschen zu arbeiten, die dieses Geschäft führen? Eines speichert und verwaltet sie in einem Umfang, für den Altsysteme nie konzipiert wurden. Das andere stellt sie in einfacher Sprache den Menschen zur Verfügung, die sie am dringendsten benötigen, mit dem Kontext und den Leitplanken, um sie vertrauenswürdig zu machen.
Die Organisationen, die dies richtig machen, erstellen nicht nur bessere Berichte. Sie treffen schnellere Entscheidungen, erkennen Probleme früher und finden Möglichkeiten, für die ihre Konkurrenten noch Tabellenkalkulationen erstellen.
Entdecken Sie, was Genie und Lakebase für Ihr Unternehmen tun können.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.