Unity AI Gateway, Glossar, cloud- und regionsübergreifende Adressierbarkeit, Governance Hub und vieles mehr
Neuerungen in Unity Catalog auf einen Blick:
*Steuern Sie, was AI-Agenten tun, und nicht nur, worauf sie zugreifen: Unity AI Gateway vereint Modelle, Agenten, Tools und MCPs unter einer einheitlichen Runtime-Governance-Ebene.
*Geben Sie Agenten den geschäftlichen Kontext, den sie benötigen: Glossar und Domänen schaffen eine gemeinsame, gesteuerte Bedeutungsquelle für Menschen und Agenten.
*Verwalten Sie Ihre gesamte Umgebung über Clouds und Regionen hinweg: ein Katalog, einheitliche Richtlinien und konsistente Governance, wo auch immer Ihre Workloads ausgeführt werden.
Die Ära der Agenten ist da. Hunderttausende von Agenten greifen mittlerweile auf Unternehmensdaten zu, fragen sie ab, analysieren sie und treffen damit Entscheidungen in Echtzeit. Dieser Wandel hat die Anforderungen an den Catalog grundlegend verändert. Der Catalog hat sich von einem System of Record zu einem Laufzeit-Entscheidungsträger für AI entwickelt.
Diese Entscheidungen erfordern drei Dinge: Kontrolle, damit jede Aktion – ob von Mensch oder Agent – kontrolliert bleibt; Kontext, damit Agenten das Geschäft verstehen und nicht mehr halluzinieren; und Wahlfreiheit, damit Sie nie an eine einzige Cloud, ein einziges Modell oder Format gebunden sind. Zusammen definieren diese Aspekte, was Governance in der Ära der Agenten bedeuten muss.
Vor fünf Jahren hat Databricks mit der Veröffentlichung von Unity Catalog Pionierarbeit im Bereich der Daten- und AI-Governance geleistet – der branchenweit einzigen einheitlichen Governance-Lösung für Daten und AI über Clouds, Datenformate und Datenplattformen hinweg. Mehr als 14.000 Unternehmen verwalten ihre Daten und AI mittlerweile mit Unity Catalog.
Heute entwickeln wir Unity Catalog weiter, um alle drei Bereiche abzudecken: Kontrolle, Kontext und Wahlfreiheit. Das ist neu.
Jahrelang bedeutete die Verwaltung eines Assets die Kontrolle des Zugriffs: Wer darf diese Tabelle abfragen, wer darf dieses Modell aufrufen. Aber Agenten greifen nicht nur auf Assets zu; sie agieren durch sie, indem sie Modelle aufrufen, Tools aktivieren und Verbindungen zu MCP-Servern herstellen. Um diesem Wandel gerecht zu werden, führen wir eine Reihe von Funktionen ein, mit denen sich der gesamte Lebenszyklus des Verhaltens eines Agenten steuern lässt.
Unity AI Gateway ist unsere Governance-Lösung für Enterprise-AI. Sie basiert auf Unity Catalog und erweitert die Governance über Daten- und AI-Assets hinaus auf die Laufzeit-Interaktionen zwischen Modellen, Agenten, MCPs, Skills und Tools:

Lesen Sie die vollständige Ankündigung zur AI-Governance.
Governance Hub, jetzt in PrPr, bietet eine zentrale Kommandozentrale für Data Stewards und Admins zur Verwaltung Ihrer Databricks-Umgebung: Überwachen Sie Ihren Sicherheitsstatus, identifizieren Sie Risiken, priorisieren Sie Behebungsmaßnahmen und skalieren Sie Governance-Prozesse für Daten, AI, Kosten und Leistung über eine einzige Benutzeroberfläche.

Vor Kurzem haben wir die allgemeine Verfügbarkeit (GA) von ABAC-Richtlinien für Zeilenfilterung und Spaltenmaskierung sowie Governed Tags und Datenklassifizierung angekündigt, um Sie beim Schutz sensibler Daten in großem Umfang zu unterstützen.
Auf dem Data + AI Summit erweitern wir ABAC um:
Die rollenbasierte Zugriffskontrolle (Public Preview in Kürze) ergänzt das kollaborative, vererbungsbasierte Identitäts- und Berechtigungsmodell von Databricks, indem sie es Kunden ermöglicht, Gruppen zu definieren, die sich wie Rollen verhalten. Eine Rolle ist einfach eine Gruppe mit einer Reihe von Berechtigungen, die Benutzer annehmen können. Wenn ein Benutzer eine Rolle annimmt, agiert er in dieser Rolle, und alle Aktionen, einschließlich des Datenzugriffs, werden für diese Rolle autorisiert.
RBAC ermöglicht es Kunden, neue Anwendungsfälle wie den exklusiven Zugriff abzubilden. Dabei bieten Rollen Grenzen für die Datenisolierung bei Projekten, die mit sensiblen Daten arbeiten, bei denen Datensätze nicht in Kombination abgerufen werden sollten (z. B. klinische Studien oder länderspezifische Daten), oder bei der Durchführung von Aufgaben mit hohen Privilegien, wie der Fehlerbehebung bei Zugriffskontrollen. Benutzer können in der UI einfach zwischen Rollen wechseln oder eine Rolle in OAuth-Client-Flows angeben, und der Workspace passt sich genau an das an, was diese Rolle zulässt.
Agenten sind nur so gut wie der Kontext, den sie haben. Ohne eine gemeinsame Definition dessen, was das Geschäft eigentlich bedeutet, wird selbst ein fähiger Agent nur raten. Unity Catalog Semantics bietet Agenten und Menschen eine einzige, gemeinsame Quelle der Wahrheit (Source of Truth). Konzepte und geschäftliche KPIs werden einmal definiert, nach Domänen organisiert und sind über SQL, APIs und MCPs zugänglich, sodass jedes Tool und jeder Agent sie ohne Bindung an einen bestimmten Anbieter nutzen kann. Jetzt erweitern wir Unity Catalog Semantics um neue Funktionen zur Definition und Organisation von Kontext.

Mit Glossary können Sie verbindliche Konzepte, Begriffe und Taxonomien definieren, die Agenten und Menschen helfen, Ihr Geschäft zu verstehen, oder bereits vorhandene importieren. Glossary-Seiten sind mit den zugrunde liegenden Daten und untereinander verknüpft, um Beziehungen abzubilden. Genie Code entwirft neue Glossary-Seiten, schlägt Verfeinerungen vor und markiert Definitionen, die von der tatsächlichen Nutzung Ihrer Daten abweichen, während Ihr gesamtes Team sie gemeinsam durch Vorschläge, Kommentare und Verantwortlichkeiten auf Domänenebene pflegt. Eine Vorschau von Glossary ist in Kürze verfügbar.

Domains, die sich jetzt in der Public Preview befinden, organisieren Ihre Daten und AI-Assets in geschäftsorientierte Kategorien. So erhalten Agents einen eingegrenzten, relevanten Kontext statt des gesamten Katalogs. Menschen durchsuchen Domains und Agents fragen sie über einen internen Marktplatz ab, wobei Zertifizierungs- und Stewardship-Signale zeigen, was verlässlich ist. AI-gestützte Domain-Vorschläge, die demnächst in der Preview verfügbar sind, schlagen Ihnen automatisch Domains vor, sodass Sie nicht alles von Grund auf neu organisieren müssen.

Dieses benutzerdefinierte semantische Fundament in Unity Catalog speist die Genie Ontology, eine kontinuierlich gelernte Kontextschicht für Unternehmen in der Databricks-Plattform. Erfahren Sie mehr über die Genie Ontology in diesem Ankündigungs-Blog.
Metriken in Unity Catalog ermöglichen es Ihnen, Ihre geschäftlichen KPIs wie Umsatz, Churn, aktive Nutzer und Marge einmalig als kontrollierte, wiederverwendbare Objekte zu definieren und sie dann konsistent über SQL, BI-Tools, APIs und Agents abzufragen. Wir erweitern die Möglichkeiten zur Modellierung und Erstellung erheblich:
Metriken sind zudem offen: Sie sind Open Source, in Apache Spark und Unity Catalog OSS verfügbar und bereit für den Open Semantic Interchange (OSI).
Externe Lineage, die jetzt allgemein verfügbar ist, erweitert die Lineage in Unity Catalog auf Assets außerhalb von Databricks. Sie können Upstream-Quellsysteme und Downstream-BI-Berichte registrieren, sodass ein einziger Lineage-Graph Ihren gesamten Datenfluss End-to-End abdeckt. Als Teil dieses Releases erfassen die verwalteten Ingestion-Pipelines von Lakeflow Connect automatisch die Lineage von Quelltabellen zu ihren Zieltabellen in Unity Catalog. Dies gibt Agents ein vollständigeres Bild davon, woher Ihre Daten stammen und wie sie sich bewegen, sodass sie zuverlässiger logische Schlüsse ziehen können.

Table Insights in Unity Catalog enthalten jetzt ein neues abgeleitetes Signal: Beliebtheit auf Spaltenebene. Auf der Übersichtsseite einer Tabelle im Catalog Explorer können Sie die relative Beliebtheit jeder Spalte sehen, gemessen daran, wie viele historische Abfragen auf der Tabelle daraus gelesen haben. Dieses Signal speist auch die Genie Ontology und verleiht ihr ein besseres Verständnis dafür, welche Spalten bei der Analyse Ihrer Tabellen am wichtigsten sind.

In der Ära der Agents können Sie sich keinen Vendor Lock-in leisten. Rechenleistung ist knapp, Modelle ändern sich schnell und Ihre Daten erstrecken sich über mehrere Clouds, Regionen und Formate. Ihre Infrastruktur muss über all diese Bereiche hinweg flexibel sein, damit Sie dort arbeiten können, wo Kapazitäten vorhanden sind, Daten in der richtigen Region halten, formatübergreifend arbeiten und neue Modelle direkt nach deren Erscheinen implementieren können – und das alles ohne Plattformwechsel. Wir kündigen mehrere neue Funktionen an, um dies zu ermöglichen.
Unity Catalog weitet die Governance nun auf die gesamte Databricks-Präsenz eines Kunden aus, über Konten, Regionen und Clouds hinweg. Ein neuer vierstufiger Namespace (metastore.catalog.schema.table) gibt jedem Asset eine einzige Adresse im gesamten Bestand. Dies bietet Kunden eine einheitliche Discovery-Erfahrung, konsistent durchgesetzte Zugriffsrichtlinien, einen einzigen Audit-Trail und eine End-to-End-Lineage auf Spaltenebene.
Regionsübergreifende Governance ist demnächst in der Preview verfügbar. Cloud- und kontoübergreifende Governance wird folgen. Sie können Ihre Databricks-Workloads in die Cloud und Region verlagern, die die passende Kapazität, GPUs oder Nähe zu Ihren Daten bietet, und die Governance bleibt überall dort konsistent, wo diese Workloads ausgeführt werden.
Verwaltetes Disaster Recovery bietet Kunden Ausfallsicherheit für ihre geschäftskritischen Workloads. Es ermöglicht Ihnen, die kritischen Teile Ihres Databricks-Deployments in eine sekundäre Region zu replizieren und im Katastrophenfall innerhalb von Minuten dorthin zu wechseln. Verwaltetes Disaster Recovery erfordert das neue „Mission Critical“-Add-on, das sowohl verwaltetes Disaster Recovery als auch unsere bestehenden Funktionen für erweiterte Sicherheit und Compliance freischaltet.
Unity Catalog ist der umfassendste und offenste Katalog in den Ökosystemen von Delta Lake und Apache Iceberg, mit jüngsten Fortschritten wie Iceberg v3 GA, Managed Iceberg GA, neuen Federation-Connectors und Engine-übergreifendem ABAC. Auf dem Data + AI Summit gehen wir noch weiter:
Vor fünf Jahren haben wir mit dem Delta Sharing-Protokoll Pionierarbeit beim offenen Teilen und der Zusammenarbeit geleistet – es ist heute das am weitesten verbreitete offene Protokoll für sicheres Zero-Copy-Data-Sharing, das von Tausenden von Unternehmen genutzt wird. Auf diesem Erfolg aufbauend haben wir letzte Woche OpenSharing angekündigt, die nächste Stufe von Delta Sharing. OpenSharing, jetzt ein Projekt der Linux Foundation, führt das erste offene, herstellerneutrale Protokoll für das sichere Teilen von AI-Assets ein, einschließlich Agent Skills, AI-Modellen und unstrukturierten Daten.
Wir kündigen nun eine Reihe von Funktionen an, um die Zusammenarbeit zu ermöglichen:
Unity Catalog entwickelt sich kontinuierlich als branchenweit einzige einheitliche Governance-Ebene weiter – das Fundament für sichere, intelligente und geschäftsorientierte Datenplattformen. Egal, ob Sie KI-Agenten entwickeln, BI-Dashboards bereitstellen oder Daten unternehmensübergreifend freigeben – Unity Catalog verbindet alles in einem einzigen, offenen Katalog.
Folgen Sie für die ersten Schritte den Unity Catalog-Leitfäden für AWS, Azure und GCP.
Registrieren Sie sich für den Data + AI Summit und entdecken Sie unsere Sessions zu Governance und Sicherheit.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.