Veröffentlicht: 11. März 2026
von Patrick Wendell, Matei Zaharia, Weston Hutchins und Gal Oshri
Wir freuen uns, Genie Code anzukündigen, die neueste Ergänzung der Databricks Genie-Familie. In den letzten sechs Monaten haben agentische Codierungstools die Software-Engineering grundlegend verändert; Genie Code bringt dieselbe Transformation nun auch für Datenteams. Genie Code kann komplexe Tasks wie das Erstellen von Pipelines, das Debugging von Fehlern, das Bereitstellen von Dashboards und die Wartung von Produktionssystemen autonom ausführen.
Im Gegensatz zu Agenten, die sich nur auf das Schreiben von Code konzentrieren, agiert Genie Code auch als proaktiver Produktionsagent. Es überwacht Ihre Lakeflow-Pipelines und KI-Modelle im Hintergrund, priorisiert Ausfälle, führt routinemäßige DBR-Upgrades durch und untersucht Anomalien, noch bevor Ihr Team sie überhaupt bemerkt.
All dies geschieht durch die tiefe Integration mit Unity Catalog, sodass es die Daten, die Semantik und die Governance-Richtlinien Ihres Unternehmens versteht. Bei praxisnahen Data-Science-Aufgaben übertrifft Genie Code einen führenden Coding-Agenten um mehr als das Zweifache.
Agentenbasierte Codierungstools haben das Software-Engineering transformiert und bewegen Entwickler über die reine Autovervollständigung hinaus in Richtung einer agentengesteuerten Entwicklung. Mit einem einzigen Prompt können Entwickler jetzt in Sekundenschnelle Features scaffolden, Code refaktorisieren und Prototypen deployen. Dieser Wandel wurde durch Fortschritte bei LLMs und durch agentenbasierte Systeme vorangetrieben, die den komplexen Kontext moderner Software-Codebasen interpretieren können.
Die meisten Agents auf dem Markt konzentrieren sich auf Code als Produkt. Für Datenteams ist Code jedoch lediglich ein Mittel, um die zugrunde liegenden Daten zu manipulieren und zu verstehen. Genau aus diesem Grund haben softwarezentrierte Agents oft Schwierigkeiten bei der Datenarbeit. In einem Datenökosystem liegt der Kontext nicht nur im Skript, sondern auch in Nutzungsmustern, Lineage und Geschäftssemantik.
Der Zugriff auf diesen Kontext ist entscheidend, da viel auf dem Spiel steht. Dashboards steuern Geschäftsentscheidungen, Pipelines betreiben Produktionssysteme und Modelle für maschinelles Lernen beeinflussen reale Ergebnisse. Für Datenteams müssen die Geschwindigkeit und die Vorteile, die Agents bieten, mit absoluter Genauigkeit, Reproduzierbarkeit und Governance einhergehen.
Genie Code ist ein KI-Agent, der speziell für Daten entwickelt wurde. Er nutzt Unity Catalog, um während Ihrer Arbeit automatisch die relevantesten Daten und Inhalte zu kuratieren. Er erstellt personalisierte Suchindizes, benutzerdefinierte Anweisungen, Wissensspeicher und extrahiert Nutzungsmuster aus der Datenherkunft (Lineage). Und das Beste daran: Je mehr Ihr Team ihn nutzt, desto intelligenter wird er. Diese tiefe Integration in Unity Catalog ist jedem System, das Daten nur von außen liest, weit überlegen.
Wir bei Databricks haben die Auswirkungen von Genie und Genie Code aus erster Hand erlebt, sowohl bei technischen als auch bei nicht-technischen Nutzern. Unser Vertriebsteam nutzt es, um sich vor Meetings ein vollständiges Bild von jedem Kunden zu machen, indem es in Sekundenschnelle Key-Verbrauchskennzahlen, Support-Tickets und aktuelle Interaktionen zusammenfasst. Produktmanager verwenden Genie Code, um Dashboards aus einer handgezeichneten Skizze von Diagrammen und Grafiken zu erstellen. Unser Finanzteam führt Budget-Ist-Analysen und erweiterte ROI-Modellierungen durch. Unser Führungsteam beantwortet Datenfragen in Echtzeit während strategischer Diskussionen, was Nachfragen reduziert und komplexe Entscheidungen beschleunigt. Im gesamten Unternehmen haben diese Tools unsere Arbeitsweise mit Daten verändert.
Was Genie Code macht:
Mit Genie Code wechseln Datenteams von der Eingabe von Prompts f ür einen Copiloten zur Delegierung echter Arbeit: dem Erstellen von Pipelines, dem Debuggen von Fehlern, dem Bereitstellen von Dashboards und der Wartung von Produktionssystemen – autonom und durchgängig.
Bei SiriusXM unterstützt Genie Code alles vom Erstellen von Notebooks und komplexen SQL-Abfragen bis hin zum Erkennen von Tabellenbeziehungen und dem Debugging von Pipelines. Es agiert als praxisorientierter Entwicklungspartner, der unseren Datenteams hilft, qualitativ hochwertige Arbeit in kürzerer Zeit zu liefern. — Bernie Graham, Vice President Data Engineering, Sirius XM
Genie Code wird nicht von einem einzigen Modell angetrieben. Es handelt sich um ein agentenbasiertes System, das Tasks über mehrere Modelle und Tools leitet und dabei automatisch das beste Modell für jeden job auswählt, sei es ein Frontier-LLM, ein Open Source-Modell oder ein benutzerdefiniertes Modell, das auf Databricks gehostet wird. Dadurch müssen Benutzer nicht mehr manuell zwischen Modellen wechseln oder raten, welches das beste Ergebnis liefert.
Genie Code ist außerdem tief in die Databricks-APIs integriert, sodass es die richtigen Assets (Vermögenswerte) identifizieren, umfangreichen Kontext zusammenstellen und qualitativ hochwertigere Abfragen generieren kann. Databricks Research optimiert das System kontinuierlich, indem es die neuesten Modelle von führenden KI-Laboren mit benutzerdefinierten Modellen auf der Plattform vergleicht.
Bei unserem jüngsten Performance-Benchmarking mit realen Data-Science- und Analyseaufgaben von internen Nutzern hat Genie Code einen führenden Coding-Agenten, der mit den Servern des Databricks Model Context Protocol (MCP) ausgestattet ist, deutlich übertroffen.

Genie Code fungiert als dedizierter ML-Ingenieur, der in Ihren Workflow eingebettet ist. Bitten Sie ihn, "ein Prognosemodell zu trainieren, das den Vertrieb in @sales_tablevorhersagt", und er wird die gesamte Pipeline durchdenken:
Sobald Genie Code auf Databricks Model Serving angewendet ist, bleibt es auf dem Laufenden: Es kann den Zustand von Endpoints überprüfen, Traces analysieren und Optimierungen empfehlen. Mehr dazu erfahren Sie unten im Abschnitt „From Code to Production: Observability with Genie Code“.

Genie Code verändert die Arbeitsweise unserer Datenteams. Anstatt Notebooks, Pipelines und Modelle manuell zusammenzufügen, können wir komplexe Workflows an einen KI-Partner übergeben, der unsere Daten, Data Governance, unseren Geschäftskontext und unsere internen Bibliotheken wie zum Beispiel Repsol Artificial Intelligence Products versteht. Es beschleunigt alles, von der Zeitreihenprognose bis zur Bereitstellung in der Produktion, ohne Einbußen bei Gründlichkeit oder Kontrolle. — Emilio Martín Gallardo, Principal Data Scientist, Datenverwaltung & Analytics, Repsol
Genie Code ist Ihr erfahrener Data Engineer, der Ihnen hilft, zuverlässige Datenpipelines zu entwerfen und weiterzuentwickeln.

Genie Code hat uns über die unterstützte Codierung hinaus zu echtem agentischem Data Engineering geführt. Es kann unsere Lakeflow-Pipelines analysieren, dateiübergreifende Änderungen mit Diffs vorschlagen, Ausführungen mit Sicherheitsvorkehrungen durchführen und Fehler so lange iterativ bearbeiten, bis die Probleme gelöst sind. Es fühlt sich weniger wie eine Autovervollständigung an und mehr wie ein in unseren Workflow eingebetteter Mitarbeiter. — Nishit Gajjar, Tech Lead, Globaler Anbieter von Infrastrukturtechnologie
Genie Code kann Visualisierungen erstellen, Filter konfigurieren und mehrseitige Dashboard-Layouts organisieren – alles mit wiederverwendbaren semantischen Definitionen. Es verbindet diese Definitionen mit Filtern, Berechnungen und Layouts, die mit wachsenden Dashboards mit Scale wachsen, und hilft Teams so, schneller voranzukommen und gleichzeitig die Konsistenz zu wahren.

Mit Genie Code liefern unsere Teams KI-gestützte Analysen und automatisierte Workflows in Wochen statt in Monaten. Low-Code-Agenten helfen uns, schneller voranzukommen und gleichzeitig die Governance-Richtlinien einzuhalten. So können Projekt- und Engineering-Teams Einblicke in natürlicher Sprache aus komplexen Daten gewinnen, ohne die Bereitstellung zu verlangsamen. — Russell Singer, Chief Data Architect, Bechtel Corporation
Geben Sie ein übergeordnetes Ziel an, wie z. B. "Risiken für Flugverspätungen identifizieren und ein Monitoring-Dashboard erstellen". Genie Code denkt die Anforderungen durch, formuliert einen mehrstufigen Plan und führt diesen über alle Databricks Notebooks, AI/BI-Dashboards und Lakeflow in einem einzigen Konversations-Thread aus.

Was wir bei Danfoss sehen, ist, dass Genie Code die Rollen innerhalb eines Datenteams verändert und damit unseren strategischen Fokus auf Digitalisierung und KI unterstützt. Data Scientist geben weiterhin die Richtung vor und führen Überprüfungen durch, aber Ingenieure, Analysten und Fachexperten können nun mit dem Assistenten aktiv in Notebooks arbeiten und zu fortgeschrittenen Analytics-Workflows beitragen. Dadurch wird Data Science zu einer viel kollaborativeren Teamaktivität. — Radu Dragusin, Principal Engineer, Data & KI, Danfoss
Genie Code verwendet Popularität, Lineage, Codebeispiele und Unity Catalog-Metadaten, um die relevantesten Datensätze für jede Analyse zu finden. Diese tiefe kontextbezogene Suche macht die manuelle Datensuche überflüssig und stellt sicher, dass Ihre Arbeit auf den genauesten und am häufigsten verwendeten Tabellen in Ihrem Unternehmen basiert.

Ich bin wirklich fasziniert. Genie Code gibt einen Einblick in die Zukunft der Datenarbeit. – Sameer Yasser, Senior Data Engineer, Sundt Construction
Genie Code ist eine flexible Plattform, die so konzipiert ist, dass sie auf die spezifischen Standards und den externen Tech-Stack Ihres Teams zugeschnitten werden kann. Es gibt drei Hauptmöglichkeiten, seine Fähigkeiten zu erweitern:
Wenn Ihnen beispielsweise ein Jira Task zugewiesen wird, ein neues ML-Modell zu trainieren, kann Genie automatisch den Kontext daraus erfassen, die Aufgabe ausführen und das Ticket mit den Ergebnissen aktualisieren.

Verbinden Sie Genie über MCP mit Ihrem internen Confluence, Google Drive, GitHub oder Notion, damit es bei der Fehlerbehebung auf die spezifischen Runbooks und Datenwörterbücher Ihres Teams zurückgreifen kann.
Das Schreiben von Code ist nur der erste Schritt. Die Wartung ist die eigentliche Herausforderung. Genie Code fungiert als Observability-Agent, um Ihre Daten- und KI-Workflows fehlerfrei zu halten. Während Tausende von Kunden Databricks für die Bereitstellung anspruchsvoller KI-Anwendungen nutzen, ist das Debugging dieser Modelle in der Produktion oft der zeitaufwändigste Teil des Lebenszyklus.
Genie Code lässt sich jetzt direkt in Databricks Model Serving und MLflow 3.0 integrieren, um diesen Prozess zu automatisieren. Anstatt logs und Traces manuell zu durchsuchen, können Sie Genie für Folgendes verwenden:


Genie Code ist so konzipiert, dass es im Hintergrund arbeitet, damit Ihre Daten auch dann intakt bleiben, wenn Sie Ihren Laptop schließen. Sie können mehrere Agents parallel bereitstellen, um die operativen Arbeiten zu erledigen, die normalerweise die Woche eines Data Engineers in Anspruch nehmen. Diese Hintergrund-Agents gehen über reaktiven Support hinaus und ermöglichen eine proaktive Wartung, indem sie repetitive Aufgaben wie das Reagieren auf Job-Fehler und das Verwalten von Routine-Upgrades erledigen. Wenn eine Pipeline ausfällt, identifiziert der Agent die Ursache und schlägt eine Lösung erst vor, nachdem er sie in einer sicheren Sandbox-Umgebung validiert hat.
Wenn beispielsweise eine Produktionspipeline aufgrund einer Schema-Nichtübereinstimmung ausfällt, z. B. wenn sich eine Spalte von INT (150) zu Strings („150 USD“) ändert, wird Genie den Fehler lokalisieren und die fehlerhafte Pipeline automatisch reparieren.
Hintergrundagenten sind bald verfügbar.
Genie Code basiert direkt auf dem Unity Catalog. Diese Integration stellt sicher, dass der Agent die gleichen Sicherheits- und Governance-Regeln wie der Rest der Databricks-Plattform befolgt.
Wenn Genie Code nach Daten sucht, werden nur die Asset (Vermögenswerte) angezeigt, auf die der Benutzer zugreifen darf. Wenn eine Pipeline erstellt wird, hält sie die bestehenden Lineage- und Zugriffskontrollen ein.
Genie Code ist jetzt allgemein verfügbar in Ihrem Databricks-Workspace. Sie finden das Genie Code-Panel bereits heute in Ihren Notebooks, im SQL-Editor und im Lakeflow-Pipelines-Editor – keine komplexe Konfiguration erforderlich.
Wenn Sie mehr über Genie Code erfahren möchten:
Wir sind gespannt zu sehen, was Sie mit Genie Code entwickeln werden und wie autonome Agenten die Arbeitsweise Ihrer Datenteams in Databricks neu gestalten werden.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
