Unity Catalog est une solution de gouvernance unifiée pour tous les assets de données et d'IA de votre lakehouse (fichiers, tables et modèles de machine learning), quel que soit le cloud utilisé.
Gouvernance centralisée pour les données et l'IA
Recherche et découverte des données intégrées
Performance à grande échelle
Traçabilité automatisée pour toutes les charges de travail
Intégration à vos outils existants

Comment ça marche
Centralisez la gestion et la gouvernance de tous vos assets de données
Grâce au modèle de gouvernance commun reposant sur la norme ouverte ANSI SQL, simplifiez la gouvernance des fichiers, tables, tableaux de bord et modèles ML, quel que soit le cloud. Définissez une fois pour toutes des politiques d'accès au niveau des comptes, puis appliquez-les à l'ensemble des charges et des espaces de travail. Unity Catalog conserve un journal des opérations effectuées sur les données, permettant un audit centralisé et précis de vos données. Vous pouvez remplir vos obligations de conformité en toute sérénité.
Gérer des contrôles d'accès précis
Utilisez les fonctions SQL standard pour définir des filtres de lignes et des masques de colonne, et permettre des contrôles d'accès spécifiques. Comme Databricks continue à développer des capacités pour améliorer l'évolutivité et l'intégration, les prochains contrôles d'accès basés sur les attributs vous permettront de définir des politiques d'accès basées sur des balises personnalisées (attributs).
Une expérience de recherche unifiée et sécurisée
Localisez, interprétez et référencez rapidement les données pertinentes de tout votre paysage grâce à une expérience de recherche unifiée, pensée pour les data analysts, les data engineers et les data scientists. Dans Unity Catalog, la recherche est sécurisée par défaut : l'accès aux résultats est limité en fonction des autorisations des utilisateurs. Vous bénéficiez donc d'une couche supplémentaire de sécurité pour la protection de la vie privée.
Des performances de requête supérieures à toutes les échelles
Unity Catalog offre des performances de requête supérieures grâce à un service de métadonnées à faible latence et au réglage automatique des tables. Les requêtes sont exécutées plus rapidement à toutes les échelles. Le compactage des données automatiques et asynchrones optimise la taille des fichiers et réduit automatiquement la latence d’entrée/sortie (E/S) en arrière-plan.
Data lineage automatisé en temps réel
Bénéficiez d'une visibilité de bout en bout sur la circulation des données dans votre lakehouse grâce au data lineage en temps réel sur toutes les charges de travail SQL, Python, Scala et R. Effectuez rapidement des contrôles de qualité des données, analysez en profondeur l'impact des modifications et déboguez la moindre erreur dans vos pipelines de données. Profitez d'une véritable traçabilité de vos tables, colonnes, notebooks, workflows et tableaux de bord. Les graphes de lineage de Unity Catalog tiennent compte des différents niveaux d'accès : leur disponibilité est donc limitée en fonction des autorisations des utilisateurs. Une API REST permet également de récupérer le lineage à des fins d'intégration à d'autres catalogues.
Partage sécurisé des données entre organisations
Unity Catalog prend en charge Delta Sharing en mode natif, le premier protocole ouvert au monde pour le partage sécurisé de données. Vous pouvez ainsi échanger facilement des données existantes aux formats Delta Lake et Apache Parquet avec n'importe quelle plateforme informatique. Les utilisateurs n'ont pas besoin d'être eux aussi sur la plateforme Databricks ou sur le même cloud. D'ailleurs, ils ne sont même pas obligés d'être sur un cloud. Vous pouvez partager des données en direct sans devoir les répliquer ni les copier sur un autre système. Grâce aux intégrations natives avec Power BI, Tableau, Spark, Pandas et Java, les destinataires sont libres d'exploiter les données partagées dans l'outil de leur choix. Vous pouvez centraliser la gestion, la gouvernance, l'audit et le suivi de consommation des données partagées sur une même plateforme.
