Direkt zum Hauptinhalt
Ankündigungen

Agent Bricks: Data + AI Summit 2026

von Hanlin Tang, Kasey Uhlenhuth, Akhil Gupta und Patrick Wendell

Letztes Jahr auf dem Data + AI Summit haben wir Agent Bricks eingeführt und damit eine neue Möglichkeit geschaffen, hochwertige Agenten zu entwickeln, die logische Schlüsse auf Basis Ihrer Daten ziehen können. Seit dem Start wurden über 100.000 Agenten erstellt, und wir verarbeiten mittlerweile mehr als 1 Billiarde Token pro Jahr für Agenten. Kunden wie AstraZeneca, 7-Eleven, Fox Corporation und Block haben Agenten auf Basis von Agent Bricks bereitgestellt. Dieses Jahr auf dem DAIS 2026 freuen wir uns, die Erweiterung von Agent Bricks zu einer umfassenden Agenten-Plattform für Entwickler anzukündigen.

Die fehlenden 99 %

Der Aufstieg des agentenbasierten Codierens, gepaart mit leistungsfähigeren Frontier-Modellen, hat eine kambrische Explosion von Agenten ausgelöst. Das Erstellen von Agenten mit den vielen Agenten-Frameworks oder -Harnesses im Ökosystem war noch nie so einfach. Im letzten Jahr haben wir jedoch gelernt, dass der eigentliche Agenten-Loop nur 1 % der Arbeit ausmacht. Die anderen 99 % sind die verborgenen technischen Schulden von agentenbasierten Systemen: Token-Kapazität, Bereitstellung, Sicherheit, Evaluierung, Monitoring, Kontext, Freigabe (siehe Abbildung unten).

Agenten-Plattform

Daher haben wir beobachtet, dass Entwickler damit beschäftigt waren, Infrastruktur aufzubauen, anstatt Agenten zu entwickeln. Dieser Moment verlangt nach einer Agenten-Plattform für Entwickler.

Wir glauben, dass eine Agenten-Plattform die Lösung von drei entscheidenden Herausforderungen erfordert:

  1. Auswahl. Agenten bestehen zunehmend aus vielen Subagenten und benötigen eine Modellvielfalt, um das richtige Gleichgewicht zwischen Qualität und Latenz zu finden. Jede Modellfamilie weist einzigartige Verhaltensweisen auf und übertrifft die anderen mit jedem Release immer wieder aufs Neue. Entwickler benötigen eine breite Modellauswahl – von proprietären Frontier- und Open-Source-Modellen über kostengünstige, aber schnelle kleinere Modelle bis hin zu Modellen, die auf ihre spezifischen Unternehmensdaten angepasst sind.
  2. Kontext. LLMs sind leistungsstarke Reasoning-Maschinen, benötigen jedoch die Fähigkeit, den richtigen Kontext abzurufen und zu verarbeiten, um geschäftlich korrekte Entscheidungen zu treffen. Dies ist ein äußerst schwieriges Problem, da die Datenlandschaft oft lückenhaft ist oder irreführende Informationen enthält, oder weil der benötigte Kontext nur in den Köpfen einzelner Personen existiert oder aus mehreren Quellen mühsam zusammengetragen werden muss.
  3. Kontrolle. Agenten gehören zu den am meisten privilegierten Akteuren in einem Unternehmen und haben Zugriff auf sensible Daten. Die Nachrichten sind voll von Berichten über Agenten, die versehentlich Codebasen gelöscht haben oder durch Prompt-Injection wertvolle Informationen preisgegeben haben. Zudem explodieren die Kosten, da Mitarbeiter durch „Tokenmaxing“ ihre Bestenlisten beim agentenbasierten Codieren in die Höhe treiben. Entwickler benötigen Möglichkeiten, Agenten sicher bereitzustellen und die Kosten zu kontrollieren, damit das Unternehmen die Bereitstellung von Agenten in großem Maßstab finanzieren kann.

Der Aufbau einer Agenten-Plattform, die diese Herausforderungen bewältigt, erfordert die Verknüpfung von Daten mit AI. Schließlich konsumieren Agenten Daten nicht nur über Tools und Kontext, sondern produzieren mittlerweile auch eine Menge Daten in ihren Ausgaben, Aktionen, Reasoning-Traces und Speichern – all dies muss kontrolliert und analysiert werden. Diese Zusammenführung von Daten und AI ist eine Aufgabe, für die Databricks einzigartig positioniert ist.

Agent Bricks

Wir freuen uns außerordentlich, die nächste Evolutionsstufe von Agent Bricks als unsere Agenten-Plattform für Entwickler anzukündigen. Was als Experiment beim Erstellen von Agenten begann, hat sich zu einer umfassenden Plattform entwickelt, mit der Entwickler Agenten mit jedem beliebigen Modell und Harness erstellen, von überall auf Daten zugreifen sowie diese sicher bereitstellen und steuern können. Wir bieten alle Bausteine, von sicheren Sandboxes über den Agenten-Speicher bis hin zur Token-Kapazität für Entwickler: Databricks kümmert sich um die Infrastruktur, während Sie wirkungsvolle Agenten erstellen.

Auswahl

Modelle

Agent Bricks bietet alle proprietären Frontier- und Open-Source-Modelle auf einer einzigen Plattform, die nativ in unsere Sicherheitsgrenzen integriert ist. Wechseln und testen Sie ganz einfach zwischen verschiedenen LLMs, um das Verhalten der Agenten mit Latenz und Kosten abzustimmen. Neben OpenAI, Anthropic, Gemini und Qwen haben wir gerade die Unterstützung für Kimi hinzugefügt. Wir freuen uns außerdem, eine Partnerschaft mit SpaceX anzukündigen, um die Grok-Modelle nativ auf Databricks verfügbar zu machen.

„Databricks bietet uns eine sichere, kontrollierte Grundlage, um mehrere Modelle auszuführen und den Anbieter zu wechseln, wenn sich unsere Anforderungen ändern. Und das alles bei gleichzeitiger Kostenkontrolle.“ — Gregory Rokita, VP of Technology, Edmunds

In den letzten drei Jahren haben wir Pionierarbeit bei maßgeschneiderten Modellen geleistet: Kunden erstellen Modelle, die auf ihre Unternehmensdaten spezialisiert sind, durch Prompt-Optimierung, Feintuning oder Reinforcement Learning. Unser Forschungsteam trainiert regelmäßig maßgeschneiderte Modelle – von kleinen Modellen für Subagenten-Aufgaben bis hin zur Anwendung von RL auf große Modelle als zentrales agentenbasiertes Modell. Vor Kurzem haben wir Reinforcement Learning eingesetzt, um einen maßgeschneiderten Daten-Agenten zu trainieren, der bei Genie-bezogenen Aufgaben mit Frontier-Modellen wie Opus und Sonnet konkurrieren kann, während er gleichzeitig deutlich geringere Kosten pro Abfrage verursacht (siehe Abbildung unten). Heute nutzen Kunden wie Merck oder First American wie AI Runtime, um LLMs zu trainieren, die auf ihre spezifischen Daten spezialisiert sind.

Abbildung: Leistung bei einem internen Genie-Benchmark, die zeigt, dass unser maßgeschneidertes Databricks-Modell (rot) sowohl eine höhere Qualität als auch geringere Kosten aufweist als die Modelle Opus und Sonnet. Hier bedeutet ein niedrigerer Preis weiter rechts auf der Achse.

Agenten-Harnesses

Wir unterstützen jedes Agenten-Harness, das Entwickler verwenden möchten – von Open-Source-Frameworks wie LangGraph, Agno und CrewAI bis hin zu Harnesses wie dem Claude Code SDK oder den OpenAI Agent SDKs. Stellen Sie diese Agenten mit horizontaler automatischer Skalierung in Databricks Apps bereit. Wir bieten auch eine verwaltete Version unseres Open-Source-Meta-Harnesses Omnigent an, das wir am vergangenen Wochenende veröffentlicht haben, um verschiedene Harnesses zu orchestrieren.

Maßgeschneiderte Agenten mit Databricks Apps bereitstellen

Kontext

Das Abrufen der richtigen Daten entspricht nicht mehr den RAG-Anwendungen von gestern. Agenten verfügen heute über hochentwickelte Tools, um Daten während des Reasoning-Prozesses zu suchen, abzurufen und zu manipulieren, um den relevanten Kontext zu identifizieren. Dennoch erfordern die heutigen Agenten-Fähigkeiten das Durchqueren einer komplexen und unordentlichen Datenlandschaft aus veralteten Tabellen, ungeordneten Google Drive-Ordnern, unübersichtlichen Websuchseiten und irreführenden Dokumenten. Oft ist der erforderliche Kontext schlichtweg nicht dokumentiert und existiert nur in den Köpfen einiger weniger Schlüsselpersonen. Der Aufstieg von AI-Slop verschmutzt die Datenlandschaft zusätzlich mit schwer überprüfbaren „Fakten“.

Unser Forschungsteam löst hier kritische Probleme wie agentenbasierte Suche, Speicherskalierung, programmierbare Notizblöcke, Evaluierung, und fundiertes Reasoning. Als Teil von Agent Bricks werden diese Innovationen in einigen Schlüsselkomponenten bereitgestellt:

  • Agenten überall mit Daten verbinden

Durch das Hinzufügen von MCP-Unterstützung zu Unity Catalog können Agenten in Agent Bricks eine sichere Verbindung zu externen Datenquellen wie Google Drive, JIRA, Slack, GitHub und anderen herstellen. Unsere spezialisierten Suchagenten können sowohl strukturierte Metadaten als auch Quelltext nutzen, um effizient die richtigen Informationen zu finden.

  • Genie-Ontologie

Durch das kontinuierliche Erlernen einer Ontologie auf Daten und die Einbindung von durch Menschen annotierter Geschäftssemantik ermöglicht die Genie-Ontologie Agent Bricks den Zugriff auf eine Fülle von Informationen, die Suche und Analyse steuern können. Wann beginnt das Geschäftsjahr? Wer leitet den Vertrieb? Was bedeutet ein abgewanderter Kunde für mein Unternehmen? Wie sieht unsere Strategie für dieses Jahr aus? Welche Tabelle wird am häufigsten verwendet? Welcher Datenautor hat die verlässlichste Historie? Die Genie-Ontologie ermöglicht es Agenten, Ihr Unternehmen von Anfang an sofort zu verstehen, ohne bei jedem Aufruf den Kontext neu erstellen zu müssen.

  • Databricks-Agenten-Tools

Wir haben eine Reihe von „integrierten“ Tools bereitgestellt, die von Databricks verwaltet werden. Diese nutzen unsere Forschungsinnovationen, um eine erstklassige Suche nach Daten im Lakehouse sowie nach externen Daten über MCPs zu ermöglichen. Beispielsweise hat unsere Arbeit im Bereich der agentischen Suche einen Unteragenten für die Dokumentsuche hervorgebracht, der jetzt dreimal schneller als zuvor ist und gleichzeitig die Qualität verbessert. Diese Tools sind in Unity Catalog zentral zugänglich und werden dort verwaltet.

  • Agenten-Speicherdienst

Entwickler, die Agenten erstellen, können diese nun mit dem verwalteten Speicher auf Databricks verbinden. Unterstützt durch Lakebase im Hintergrund können Agenten ihren eigenen Kontext und Verlauf von Sitzungen verwalten und diese über Sitzungen hinweg und schließlich auch über Agenten hinweg beibehalten.

  • Dokumenten-Intelligenz

Seit unserem Start im letzten Jahr ermöglicht eine Reihe von SQL-Funktionen, die wir als Document Intelligence (GA) bezeichnen, modernstes Parsing und die Analyse von PDFs und anderen Dokumenten. Mit ai_parse_document, ai_extract und ai_classify ist das Erstellen von Workflows zur Dokumentenverarbeitung oder von Unteragenten ganz einfach. Basierend auf unserem internen Benchmark für Dokumentenanalyse-Aufgaben in Unternehmen bietet unser System sowohl die höchste Qualität als auch die niedrigsten Kosten im Vergleich zu führenden LLMs und spezialisierten Systemen anderer Anbieter.

  • Databricks Sandbox

Der sichere Zugriff auf den Kontext erfordert eine sorgfältige Isolierung und Eingrenzung der Zugriffsberechtigungen. Databricks Sandbox ermöglicht das Bereitstellen sicherer VMs für Berechnungen sowie einen eingeschränkten Datenzugriff auf Unity Catalog. Diese Sandboxes können verwendet werden, um Code-Interpreter-Tools auszuführen, Unteragenten und Testumgebungen auszuführen oder einfach als sicherer Entwurfsbereich für Experimente mit Agenten zu dienen.

Kontrolle

Die kambrische Explosion von Agenten, Modellen und Tools erfordert eine ebenso starke Gegenkraft in Form von Governance, um diese Agenten sicher bereitzustellen und deren Kosten zu verwalten. Wir freuen uns, Unity AI Gateway anzukündigen, eine einheitliche Governance-Ebene für alle Ihre KI-Assets, sowohl auf Databricks als auch extern gehostet. Jeder Kunde sollte Unity AI Gateway nutzen, um seine KI-Assets zu sichern, zu beobachten und zu verwalten – von MCPs über Modelle bis hin zu externen Agenten.

Wir haben die Kernfunktionen einer Governance-Plattform in Unity AI Gateway implementiert:

  • Einen Katalog aller Agenten, Modelle, MCPs, Skills und externen Agenten entdecken
  • Feingranulare Zugriffskontrollen für Tools und Agenten konfigurieren
  • Kosten überwachen und Budgets pro Benutzer und pro Gruppe durchsetzen
  • Intelligentes Routing von Datenverkehr basierend auf Zuverlässigkeit, Budgetrichtlinien oder anderen Kontrollen

Aber es gibt einige entscheidende Funktionen, die nur eine kombinierte Daten- und KI-Plattform wie Databricks bieten kann:

Agenten-Traces und -Überwachung

Agenten erzeugen große Mengen an Daten aus ihren Argumentations-Traces, Speicherschreibvorgängen und Generierungen. Diese Daten sollten im Lakehouse zusammen mit den restlichen Daten verwaltet werden und nicht isoliert bei einem anderen Anbieter liegen. Die Vorteile hören hier nicht auf – da sich die Daten nun im Lakehouse befinden, können Sie die gesamte Leistung von Databricks nutzen, um diese Traces zu analysieren, die Qualität der Agenten zu debuggen, KI-Codierungssitzungen zu analysieren und zu optimieren sowie das Verhalten in der Produktion zu überwachen. Jetzt integriert in LakeWatch, unsere agentische Sicherheitsplattform, können Sie Warnmeldungen für PII-Verstöße konfigurieren, den Zugriff auf sensible Daten prüfen und auf Sicherheitsvorfälle reagieren.

Kontextuelle Richtlinien

Agenten sind zustandsabhängig, dynamisch und kontextbezogen, und das sollten auch die Sicherheitsrichtlinien sein, die sie regeln. Erstellen Sie benutzerdefinierte Sicherheitsrichtlinien für Tools und Guardrails für Agenten direkt in SQL (und bald auch in Python). Wichtig ist, dass diese Richtlinien den Zustand beibehalten und je nach Daten und Kontext reagieren können.

Im folgenden Beispiel können Sie beispielsweise eine Richtlinie so definieren, dass ein Agent, wenn er auf sensible Kundendaten mit PII zugreift, diese Daten nicht auf einer Unternehmenswebsite veröffentlichen darf, sie aber per E-Mail an einen Kollegen senden kann. Andere Aktionen, wie das Aktualisieren von Salesforce, würden eine menschliche Genehmigung erfordern.

Unity Catalog-Registrierung für Agenten, Tools und Modelle

Wir haben Agenten, Tools und Modelle zu Unity Catalog (UC) hinzugefügt, damit Sie diese Assets zusammen mit Ihrem restlichen Datenbestand verwalten können. KI-Governance lässt sich nicht von Daten-Governance trennen. Agenten, Modelle und Tools arbeiten letztendlich mit Unternehmensdaten. Die gemeinsame Verwaltung von Daten und KI bietet konsistente Richtlinien, End-to-End-Transparenz und eine einzige Steuerungsebene für Sicherheit, Compliance und Auditing.

Eine umfassende Abhandlung über KI-Governance finden Sie im Unity AI Gateway-Blog.

Wir freuen uns, Agent Bricks as unsere voll ausgestattete Agenten-Plattform anzukündigen. Wir sind davon überzeugt, dass die Zukunft von Agenten eine Kombination aus Daten und KI auf einer einzigen Plattform erfordert, damit Entwickler Agenten problemlos in der Produktion erstellen und betreiben können. Durch die Bereitstellung von Modellauswahl, relevantem Kontext und vollständiger Governance ist Agent Bricks bereit für die Erstellung Ihrer agentischen Anwendung. Wir können es kaum erwarten zu sehen, was Sie entwickeln werden.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.