Direkt zum Hauptinhalt

Erweiterung der Agenten-Governance mit Unity AI Gateway

Steuern und prüfen Sie KI-Agenten und Coding-Assistenten mit einheitlicher Governance, Transparenz und Leitplanken.

Unity AI Gateway

Veröffentlicht: 15. April 2026

Produkt6 min Lesezeit

Summary

  • Jetzt MCP-Governance unterstützen: Steuern Sie, welche Agenten mit feingranularen Berechtigungen auf externe Systeme zugreifen können, einschließlich On-Behalf-Of (OBO)-Zugriff.
  • End-to-End-Beobachtbarkeit für Agenten: Überwachen Sie LLM- und MCP-Aufrufe, überwachen Sie die Nutzung und ordnen Sie Kosten Modellen, Teams und Workflows zu.
  • Flexiblerer und zuverlässigerer Modellzugriff: Verwenden Sie eine einheitliche API über Modelle hinweg mit integrierten Fallbacks, Ratenbegrenzungen und Leitplanken.

Heute kündigen wir wichtige Erweiterungen für AI Gateway an. Im Rahmen dieser Veröffentlichung ist AI Gateway nun Teil von Unity Catalog als Unity AI Gateway. Dies erweitert das Governance-Modell von Unity Catalog auf agentielle KI, sodass Sie dieselben Berechtigungen, Prüfprotokolle und Richtlinienkontrollen für den Zugriff von Agenten auf LLMs und die Interaktion mit Tools wie MCP-Servern und APIs anwenden können.

Hier ist, was passiert, wenn ein KI-Agent eine Kundenfrage beantwortet: Er ruft ein LLM auf, um die Anfrage zu interpretieren, ruft den Bestellverlauf von Salesforce über einen MCP-Server ab, prüft Echtzeit-Versanddaten über eine interne API und ruft dann erneut das LLM auf, um eine Antwort zu entwerfen. Gesamtdauer: unter einer Sekunde. Gesamte Transparenz darüber, wer auf welche Daten zugegriffen hat, welche Systeme aufgerufen wurden und ob Richtlinien eingehalten wurden: fast keine.

Geändert haben sich nicht nur die Tools, sondern die Architektur. KI-Agenten orchestrieren jetzt mehrstufige Workflows über Modelle und Systeme hinweg und greifen dabei oft bei jedem Schritt auf sensible Daten zu. Das kann die Abfrage einer Datenbank, der Aufruf einer externen API oder die Verwendung von Coding-Agenten wie Cursor, Codex oder Claude Code zur Generierung oder Änderung von Code sein.

Und das wirft neue Fragen auf: Wer hat jede Aktion autorisiert? Welche Daten wurden mit welchem Modell geteilt? Wurden die Richtlinien konsistent durchgesetzt? Wenn etwas schiefgeht, können Sie die gesamte Kette nachverfolgen?

Herkömmliche Governance-Tools waren für diese Welt nicht ausgelegt. Sie arbeiten in Silos und können keine einheitliche Sicht über den gesamten Lebenszyklus der Aktionen eines Agenten bieten.

Mit dieser Veröffentlichung erweitern wir die Governance-Funktionen von Unity Catalog, um KI-Agenten abzudecken. Unity AI Gateway ermöglicht es Ihnen, den LLM-Zugriff zu steuern, die Nutzung von MCP-Servern und APIs durch Agenten zu regeln und konsistente Richtlinien über Modelle und Tools hinweg anzuwenden. Dies beinhaltet neue Unterstützung für die MCP-Governance, sodass Sie steuern können, welche Agenten auf welche externen Systeme zugreifen können, und nachverfolgen können, wie diese Daten verwendet werden. Für einen tieferen Einblick lesen Sie unseren Anleitungsblog über die sichere Verbindung von Agenten mit externen MCPs.

Sie erhalten außerdem detaillierte Beobachtbarkeit sowohl für LLM- als auch für MCP-Aufrufe, zusammen mit einer detaillierten Kostenverfolgung über Modelle, Teams und Workflows hinweg. Darüber hinaus bietet Unity AI Gateway eine einheitliche Möglichkeit zur Zusammenarbeit über Modelle hinweg, mit integrierten Fallbacks, Ratenbegrenzungen und Schutzmaßnahmen, die Ihnen helfen, Agenten zuverlässig in der Produktion auszuführen.

Einige der unten beschriebenen Funktionen sind in der Beta-Version verfügbar

AI Gateway landing page

Sie können jetzt einen neuen LLM-Endpunkt oder MCP-Server in Sekundenschnelle einrichten – wählen Sie Ihr Modell (Claude Opus 4.6, GPT-4, Gemini, Llama oder eine beliebige anbieterspezifische API) und konfigurieren Sie die Governance einmal. Derselbe Rahmen gilt für Anthropic, OpenAI, Google und Open-Source-Modelle.

Geben Sie Ihrem Support-Team einen Claude-Endpunkt für konversationelle KI. Verwenden Sie GPT-4 für die Extraktion strukturierter Daten. Rüsten Sie Ihre Ingenieure mit Codex oder Claude für Coding-Agenten aus. Integrieren Sie Gemini für multimodale Workflows. Sie können das richtige Modell für jede Aufgabe auswählen, ohne die Governance jedes Mal neu konfigurieren zu müssen. Richtlinien bleiben über Anbieter hinweg konsistent – keine doppelte Einrichtung, keine separaten zu verwaltenden Konfigurationen.

AI Gateway endpoint configuration

Feingranulare Berechtigungen und Schutzmaßnahmen

Feingranulare Berechtigungen und Schutzmaßnahmen verhindern, was gar nicht erst passieren sollte.

Granulare Zugriffskontrolle für Tools

Wenn Agenten MCP-Server aufrufen, um auf interne Systeme zuzugreifen, unterstützt Unity AI Gateway die Ausführung im Auftrag eines Benutzers. Der MCP wird mit den genauen Berechtigungen des anfragenden Benutzers ausgeführt, nicht mit einem gemeinsam genutzten Dienstkonto. Wenn ein Benutzer keinen Zugriff auf einen Salesforce-Datensatz hat, hat auch der Agent keinen Zugriff – selbst mit erhöhten Berechtigungen.

Flexible Schutzmaßnahmen, die von LLM-Richtern angetrieben werden (Beta)

Die Schutzmaßnahmen von Unity AI Gateway verwenden einen Prompt- + Modell-Ansatz – konfigurieren Sie sie für die Ausführung bei Anfragen, Antworten oder beidem:

  • PII-Erkennung & -Schwärzung: Erkennt und maskiert E-Mails, Sozialversicherungsnummern, Telefonnummern, bevor sie externe Modelle erreichen
  • Inhaltssicherheit: Blockiert toxische, schädliche oder unangemessene Inhalte mit anpassbaren Filtern
  • Prompt-Injection-Erkennung: Erkennt Jailbreak-Versuche, die versuchen, Systemanweisungen zu umgehen
  • Schutz vor Datenexfiltration: Verhindert die Offenlegung von Trainingsdaten oder proprietären Inhalten
  • Halluzinationsschutz: Validiert Antworten anhand von Grounding-Quellen
  • Benutzerdefinierte Schutzmaßnahmen: Definieren Sie Ihre eigenen mit einem benutzerdefinierten Prompt und Modell

Jede Schutzmaßnahme wird durch einen bearbeitbaren Prompt und ein konfigurierbares Modell unterstützt – keine starre, vordefinierte Logik. Bei Verstößen kann Unity AI Gateway die Anfrage ablehnen oder sensible Daten maskieren. Alle Aktionen werden zur Überprüfung protokolliert. Diese Funktion wird derzeit ausgerollt und wird in allen unterstützten Regionen innerhalb der nächsten Woche verfügbar sein.

End-to-End-Beobachtbarkeit

Drei Teams benötigen Antworten, wenn KI-Agenten in die Produktion gehen: FinOps möchte wissen, was Geld kostet, das Engineering muss Fehler beheben, die Sicherheit benötigt Audit-Trails. Unity AI Gateway gibt jedem Team, was es braucht, aus derselben einheitlichen Protokollierungs-Infrastruktur.

AI Gateway Usage Analytics Dashboard

Für FinOps: Kosten nach dem verfolgen, was Ihnen wichtig ist

Jede Anfrage wird in Unity Catalog-Systemtabellen mit tatsächlichen Dollar-Kosten protokolliert – nicht nur Token-Zählungen. Bereitgestellte Durchsatzverfügbarkeit, Pay-per-Token-Nutzung und externe Modellpreise werden automatisch berechnet. Teilen Sie die Kosten auf, wie auch immer Ihre Organisation budgetiert:

  • Endpunkt-Tags: Gruppierung nach Team, Umgebung oder Kostenstelle
  • Anfrage-Tags: Dynamische Zuordnung für SaaS-Plattformen, die für Endkunden weitergeleitet werden
  • Identität: Aggregation nach Benutzer oder Service Principal – Zuordnung von Ausgaben zu Budgetinhabern
  • Modell und Anbieter: Verfolgen Sie, welche Modelle (Opus vs. Sonnet) und Anbieter (Anthropic vs. OpenAI) Kosten verursachen

Für das Engineering: Vollständige Payloads für die Fehlerbehebung

Aktivieren Sie Inferenztabellen , die vollständige Anfrage-/Antwort-Payloads, Latenz, Statuscodes und Fehler in Delta-Tabellen erfassen. Wenn ein Agent fehlschlägt, verfolgen Sie genau, welcher Prompt gesendet wurde, was das Modell zurückgegeben hat und wo es fehlgeschlagen ist – und verwenden Sie Tools wie Genie Code und MLflow, um Probleme schnell zu beheben und zu lösen.

AI Gateway Inference Tables

Für die Sicherheit: Vollständige Audit-Trails

Jede Anfrage protokolliert die anfragende Identität, den Zeitstempel und – bei MCP-Aufrufen – den Verbindungsnamen, die HTTP-Methode und ob der Aufruf im Auftrag eines Benutzers erfolgte. Unity Catalog-Berechtigungen steuern, wer was sieht.

Eine einzige Protokollierungs-Infrastruktur unterstützt drei kritische Anwendungsfälle – basierend auf Delta-Tabellen, die Ihnen gehören und die Sie kontrollieren.

Zuverlässigkeit und Flexibilität für die Produktion

Unity AI Gateway bietet Ihnen Flexibilität bei der Art und Weise, wie Sie Modelle aufrufen, je nachdem, was Ihre Anwendung benötigt.

Einheitliche APIs für nahtlosen Anbieterwechsel (Beta)

Wenn Portabilität wichtig ist – und das sollte sie sein –, verwenden Sie die OpenAI-kompatible API von Unity AI Gateway. Ihr Code bleibt bei jedem Anbieter gleich. Schreiben Sie Ihre Anwendung einmal und wechseln Sie dann zwischen beliebigen Modellen, indem Sie die Endpunktkonfiguration ändern. Keine Codeänderungen, keine erneute Bereitstellung.

Automatisches Failover hält Systeme am Laufen (Beta)

Konfigurieren Sie Fallback-Modelle, und Unity AI Gateway kümmert sich automatisch um Fehler. Wenn Ihr primäres Modell Ratenbegrenzungen erreicht oder Fehler zurückgibt, werden Anfragen nacheinander an Ihr Backup-Modell weitergeleitet, bis eines erfolgreich ist. Opus-Kontingent erschöpft? Der Datenverkehr wird auf Sonnet umgeleitet. Anbieter hat eine Störung? Ihre Anwendung wird zu einer Alternative weitergeleitet. Keine manuelle Intervention, keine Ausfallzeiten.

Schließlich ermöglicht Ihnen das Unity AI Gateway, Ratenbegrenzungen auf Endpunkt-, Benutzer- oder Gruppenebene festzulegen, um außer Kontrolle geratene Kosten zu verhindern und Ihre SLA zu schützen, bevor Probleme auftreten.

AI Gateway Fallbacks
LEITFADEN

Ihr kompakter Leitfaden für moderne Analytics

Erste Schritte mit dem Unity AI Gateway

Die oben beschriebenen neuen Funktionen sind in unterstützten Databricks-Regionen verfügbar. Öffnen Sie Ihren Workspace, navigieren Sie in der Seitenleiste zum Unity AI Gateway und beginnen Sie, Ihren GenAI-Stack – LLMs und MCPs – von einem Ort aus zu verwalten. Erfahren Sie mehr in der Dokumentation und im Blogbeitrag über die sichere Verbindung von Agents mit externen MCPs.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Never miss a Databricks post

Subscribe to our blog and get the latest posts delivered to your inbox