Unity Catalog ist eine einheitliche Governance-Lösung für alle Daten- und KI-Assets einschließlich Dateien, Tabellen und Machine-Learning-Modellen in Ihrem Lakehouse in jeder Cloud.
Zentralisierte Governance für Daten und KI
Integrierte Datensuche und -erkennung
Leistung und Skalierbarkeit
Automatisierte Herkunftsbestimmung für alle Workloads
In vorhandene Tools integrierbar

Wie es funktioniert
Alle Daten-Assets zentral verwalten und kontrollieren
Mit einem gängigen Governance-Modell basierend auf offenem Standard ANSI SQL vereinfachen Sie die Governance für Dateien, Tabellen, Dashboards und ML-Modelle in jeder Cloud. Definieren Sie Zugriffsrichtlinien einmal auf Kontoebene und setzen Sie sie für alle Workloads und Arbeitsbereiche durch. Unity Catalog bietet außerdem zentralisiertes, fein abgestimmtes Auditing, indem er ein Auditprotokoll der für die Daten durchgeführten Aktionen erfasst und Ihnen hilft, Ihre Compliance- und Audit-Anforderungen zu erfüllen.
Feingeprüfte Zugriffskontrollen verwalten
Verwenden Sie Standard-SQL-Funktionen, um Zeilenfilter und Spaltenmasken zu definieren, die detaillierte Zugriffskontrollen für Zeilen und Spalten ermöglichen. Da Databricks weiterhin Funktionen zur Verbesserung der Skalierbarkeit und Integration ausbaut, werden Sie mit den kommenden attributbasierten Zugriffssteuerungen Zugriffsrichtlinien basierend auf benutzerdefinierten Tags (Attributen) definieren können.
Einheitliches und sicheres Datensucherlebnis
Finden, verstehen und referenzieren Sie schnell relevante Daten aus Ihrem gesamten Datenbestand mit einer einheitlichen Datensuche für Datenanalysten, Data Engineers und Data Scientists. Die Datensuche in Unity Catalog ist standardmäßig sicher, indem sie die Suchergebnisse auf der Grundlage der Zugriffsrechte der Benutzer einschränkt und eine zusätzliche Sicherheitsebene aus Datenschutzgründen hinzufügt.
Verbesserte Abfrageleistung in jeder Größenordnung
Unity Catalog bietet eine verbesserte Abfrageleistung mit Metadaten mit geringer Latenz und automatischer Tabellenabstimmung, was zu einer schnelleren Ausführung von Abfragen in jeder Größenordnung führt. Asynchrone automatische Datenverdichtung optimiert Dateigrößen und reduziert die E/A-Latenz (Eingang/Ausgang) automatisch im Hintergrund.
Automatisierte Datenherkunftsbestimmung in Echtzeit
Verschaffen Sie sich einen umfassenden Überblick über den Datenfluss in Ihrem Lakehouse mit automatisierter und Echtzeit-Datenherkunftsbestimmung über alle Workloads in SQL, Python, Scala und R hinweg. Führen Sie schnell Datenqualitätsprüfungen durch, führen Sie eine umfassende Analyse der Auswirkungen von Datenänderungen durch und beheben Sie Fehler in Ihren Datenpipelines. Profitieren Sie von Herkunftsbestimmung über Tabellen, Spalten, Notebooks, Workflows und Dashboards hinweg. Herkunftsdiagramme in Unity Catalog sind berechtigungsbewusst und beschränken den Zugriff basierend auf den Zugriffsberechtigungen der Benutzer. Die Herkunft kann auch über die REST-API abgerufen werden, um die Integration mit anderen Katalogen zu unterstützen.
Sicherer Datenaustausch zwischen Organisationen
Unity Catalog unterstützt nativ Delta Sharing, das weltweit erste offene Protokoll für die sichere Datenfreigabe, mit dem Sie vorhandene Daten problemlos in Delta Lake- und Apache Parquet-Formaten für jede beliebige Computerplattform freigeben können. Verbraucher müssen sich nicht auf der Databricks-Plattform, in derselben Cloud oder überhaupt in einer Cloud befinden. Sie können Live-Daten freigeben, ohne sie zu replizieren oder auf ein anderes System zu kopieren. Native Integrationen mit Power BI, Tableau, Spark, Pandas und Java ermöglichen es Empfängern, freigegebene Daten direkt aus den Tools ihrer Wahl zu nutzen. Verwalten, kontrollieren, prüfen und verfolgen Sie die Nutzung der freigegebenen Daten zentral auf einer Plattform.
