Unity Catalog est une solution de gouvernance unifiée pour tous les assets de données et d'IA de votre lakehouse (fichiers, tables et modèles de machine learning), quel que soit le cloud utilisé.

Gouvernance centralisée pour les données et l'IA
Avec un modèle de gouvernance commun basé sur ANSI SQL, centralisez la gouvernance des fichiers, des tables, des tableaux de bord et des modèles ML sur n’importe quel cloud.

Recherche et découverte des données intégrées
Localisez, interprétez et référencez rapidement les données de tout votre paysage pour une productivité maximale.

Performance à grande échelle
Bénéficiez de meilleures performances pour vos requêtes grâce au service de métadonnées à faible latence et à l'optimisation automatique des tables.

Traçabilité automatisée pour toutes les charges de travail
Créez une vue unifiée et transparente de l'ensemble de votre écosystème de données, enrichie par une traçabilité fine et automatisée de toutes les charges de travail SQL, R, Python, Scala, sur tous les types de ressources : tables, notebooks, workflows et tableaux de bord.

Intégration à vos outils existants
Appuyez-vous sur vos catalogues de données et solutions de gouvernance existants pour pérenniser votre stratégie de gouvernance des données et de l'IA.
Comment ça marche

Centralisez la gestion et la gouvernance de tous vos assets de données
Grâce au modèle de gouvernance commun reposant sur la norme ouverte ANSI SQL, simplifiez la gouvernance des fichiers, tables, tableaux de bord et modèles ML, quel que soit le cloud. Définissez une fois pour toutes des politiques d'accès au niveau des comptes, puis appliquez-les à l'ensemble des charges et des espaces de travail. Unity Catalog conserve un journal des opérations effectuées sur les données, permettant un audit centralisé et précis de vos données. Vous pouvez remplir vos obligations de conformité en toute sérénité.

Gérer des contrôles d'accès précis
Utilisez les fonctions SQL standard pour définir des filtres de lignes et des masques de colonne, et permettre des contrôles d'accès spécifiques. Comme Databricks continue à développer des capacités pour améliorer l'évolutivité et l'intégration, les prochains contrôles d'accès basés sur les attributs vous permettront de définir des politiques d'accès basées sur des balises personnalisées (attributs).

Une expérience de recherche unifiée et sécurisée
Localisez, interprétez et référencez rapidement les données pertinentes de tout votre paysage grâce à une expérience de recherche unifiée, pensée pour les data analysts, les data engineers et les data scientists. Dans Unity Catalog, la recherche est sécurisée par défaut : l'accès aux résultats est limité en fonction des autorisations des utilisateurs. Vous bénéficiez donc d'une couche supplémentaire de sécurité pour la protection de la vie privée.

Des performances de requête supérieures à toutes les échelles
Unity Catalog offre des performances de requête supérieures grâce à un service de métadonnées à faible latence et au réglage automatique des tables. Les requêtes sont exécutées plus rapidement à toutes les échelles. Le compactage des données automatiques et asynchrones optimise la taille des fichiers et réduit automatiquement la latence d’entrée/sortie (E/S) en arrière-plan.

Data lineage automatisé en temps réel
Bénéficiez d'une visibilité de bout en bout sur la circulation des données dans votre lakehouse grâce au data lineage en temps réel sur toutes les charges de travail SQL, Python, Scala et R. Effectuez rapidement des contrôles de qualité des données, analysez en profondeur l'impact des modifications et déboguez la moindre erreur dans vos pipelines de données. Profitez d'une véritable traçabilité de vos tables, colonnes, notebooks, workflows et tableaux de bord. Les graphes de lineage de Unity Catalog tiennent compte des différents niveaux d'accès : leur disponibilité est donc limitée en fonction des autorisations des utilisateurs. Une API REST permet également de récupérer le lineage à des fins d'intégration à d'autres catalogues.

Partage sécurisé des données entre organisations
Unity Catalog prend en charge Delta Sharing en mode natif, le premier protocole ouvert au monde pour le partage sécurisé de données. Vous pouvez ainsi échanger facilement des données existantes aux formats Delta Lake et Apache Parquet avec n'importe quelle plateforme informatique. Les utilisateurs n'ont pas besoin d'être eux aussi sur la plateforme Databricks ou sur le même cloud. D'ailleurs, ils ne sont même pas obligés d'être sur un cloud. Vous pouvez partager des données en direct sans devoir les répliquer ni les copier sur un autre système. Grâce aux intégrations natives avec Power BI, Tableau, Spark, Pandas et Java, les destinataires sont libres d'exploiter les données partagées dans l'outil de leur choix. Vous pouvez centraliser la gestion, la gouvernance, l'audit et le suivi de consommation des données partagées sur une même plateforme.
Intégrations transparentes avec vos outils existants
Unity Catalog fonctionne avec vos catalogues de données, systèmes de stockage de données et solutions de gouvernance existants afin que vous puissiez tirer parti de vos investissements existants et créer un modèle de gouvernance à l’épreuve du temps sans coûts de migration coûteux.
Données et stockage cloud
Gouvernance des données et partenaires de catalogue
Clientèle

« Unity Catalog nous a aidés à simplifier la gestion des données et les contrôles d'accès dans toute l'entreprise. L'équipe chargée des données de Compass a intégré en toute sécurité plus de 100 sources de données, migré tous les espaces de travail vers Unity Catalog et créé une couche d'or dans laquelle les principales parties prenantes peuvent puiser pour obtenir des informations sur des domaines tels que les clients, les produits, l'utilisation, les revenus et bien plus encore - créant ainsi une source unique de vérité, avec des contrôles d'accès complets dans toute l'entreprise."

« Unity Catalog a considérablement simplifié notre mise en place du contrôle d’accès basé sur les rôles. Nous avons désormais la possibilité de sécuriser les données au niveau du catalogue, de la base de données, de la table et de la colonne. Nous provisionnons de manière transparente le niveau d’accès approprié à tous les utilisateurs. Nous avons la possibilité de conformer la gestion et la sécurisation de l'accès aux données à nos politiques strictes de conformité et de confidentialité, en toute confiance. »

« En adoptant Unity Catalog, Milliman a pu tisser un lien direct entre ses vastes assets de données et ses utilisateurs, grâce à une gestion simplifiée des accès et une réduction de la complexité du stockage. Unity Catalog permet à Milliman de disposer d'une capacité d'exploration collaborative des données et d'un stockage rationalisé, tout en respectant les normes strictes du secteur de la santé. Avec Unity Catalog, nous pouvons évoluer rapidement en fonction des besoins de nos clients. »

" Unity Catalog nous permet de construire une plateforme de nouvelle génération qui libère tout le potentiel des véhicules définis par logiciel qui évoluent et s'améliorent au fur et à mesure qu'ils accumulent des kilomètres - améliorant ainsi l'expérience de conduite des clients et maximisant les avantages environnementaux du transport électrifié. Nous disposons désormais d'un catalogue de données centralisé et d'une gestion de l'accès à travers diverses équipes et espaces de travail, ce qui a ouvert des possibilités de collaboration et d'innovation sans précédent."

« Unity Catalog a vraiment changé la donne pour nous. Nos analystes peuvent accéder aux tables externes AWS en temps réel dans les espace de travail de Databricks et les joindre aux tables Delta Lake. Nous profitons ainsi des avantages de performance offerts par Databricks SQL sans faire migrer nos tables Glue. Avec Unity Catalog, différentes équipes peuvent collaborer sans devoir constamment changer les données de place. »