Unity Catalog

Gouvernance unifiée pour les données, l'analytique et l'IA

DémarrerRegarder la démo

Unity Catalog est une solution de gouvernance unifiée pour tous les assets de données et d'IA de votre lakehouse (fichiers, tables et modèles de machine learning), quel que soit le cloud utilisé.

Gouvernance centralisée pour les données et l'IA

Avec un modèle de gouvernance commun basé sur ANSI SQL, centralisez la gouvernance des fichiers, des tables, des tableaux de bord et des modèles ML sur n’importe quel cloud.

Recherche et découverte des données intégrées

Localisez, interprétez et référencez rapidement les données de tout votre paysage pour une productivité maximale.

Performance à grande échelle

Bénéficiez de meilleures performances pour vos requêtes grâce au service de métadonnées à faible latence et à l'optimisation automatique des tables.

Traçabilité automatisée pour toutes les charges de travail

Créez une vue unifiée et transparente de l'ensemble de votre écosystème de données, enrichie par une traçabilité fine et automatisée de toutes les charges de travail SQL, R, Python, Scala, sur tous les types de ressources : tables, notebooks, workflows et tableaux de bord.

Intégration à vos outils existants

Appuyez-vous sur vos catalogues de données et solutions de gouvernance existants pour pérenniser votre stratégie de gouvernance des données et de l'IA.
image d'arrière-plan

Comment ça marche

Centralisez la gestion et la gouvernance de tous vos assets de données

Grâce au modèle de gouvernance commun reposant sur la norme ouverte ANSI SQL, simplifiez la gouvernance des fichiers, tables, tableaux de bord et modèles ML, quel que soit le cloud. Définissez une fois pour toutes des politiques d'accès au niveau des comptes, puis appliquez-les à l'ensemble des charges et des espaces de travail. Unity Catalog conserve un journal des opérations effectuées sur les données, permettant un audit centralisé et précis de vos données. Vous pouvez remplir vos obligations de conformité en toute sérénité.

Gérer des contrôles d'accès précis

Utilisez les fonctions SQL standard pour définir des filtres de lignes et des masques de colonne, et permettre des contrôles d'accès spécifiques. Comme Databricks continue à développer des capacités pour améliorer l'évolutivité et l'intégration, les prochains contrôles d'accès basés sur les attributs vous permettront de définir des politiques d'accès basées sur des balises personnalisées (attributs).

Une expérience de recherche unifiée et sécurisée

Localisez, interprétez et référencez rapidement les données pertinentes de tout votre paysage grâce à une expérience de recherche unifiée, pensée pour les data analysts, les data engineers et les data scientists. Dans Unity Catalog, la recherche est sécurisée par défaut : l'accès aux résultats est limité en fonction des autorisations des utilisateurs. Vous bénéficiez donc d'une couche supplémentaire de sécurité pour la protection de la vie privée.

Des performances de requête supérieures à toutes les échelles

Unity Catalog offre des performances de requête supérieures grâce à un service de métadonnées à faible latence et au réglage automatique des tables. Les requêtes sont exécutées plus rapidement à toutes les échelles. Le compactage des données automatiques et asynchrones optimise la taille des fichiers et réduit automatiquement la latence d’entrée/sortie (E/S) en arrière-plan.

Data lineage automatisé en temps réel

Bénéficiez d'une visibilité de bout en bout sur la circulation des données dans votre lakehouse grâce au data lineage en temps réel sur toutes les charges de travail SQL, Python, Scala et R. Effectuez rapidement des contrôles de qualité des données, analysez en profondeur l'impact des modifications et déboguez la moindre erreur dans vos pipelines de données. Profitez d'une véritable traçabilité de vos tables, colonnes, notebooks, workflows et tableaux de bord. Les graphes de lineage de Unity Catalog tiennent compte des différents niveaux d'accès : leur disponibilité est donc limitée en fonction des autorisations des utilisateurs. Une API REST permet également de récupérer le lineage à des fins d'intégration à d'autres catalogues.

Partage sécurisé des données entre organisations

Unity Catalog prend en charge Delta Sharing en mode natif, le premier protocole ouvert au monde pour le partage sécurisé de données. Vous pouvez ainsi échanger facilement des données existantes aux formats Delta Lake et Apache Parquet avec n'importe quelle plateforme informatique. Les utilisateurs n'ont pas besoin d'être eux aussi sur la plateforme Databricks ou sur le même cloud. D'ailleurs, ils ne sont même pas obligés d'être sur un cloud. Vous pouvez partager des données en direct sans devoir les répliquer ni les copier sur un autre système. Grâce aux intégrations natives avec Power BI, Tableau, Spark, Pandas et Java, les destinataires sont libres d'exploiter les données partagées dans l'outil de leur choix. Vous pouvez centraliser la gestion, la gouvernance, l'audit et le suivi de consommation des données partagées sur une même plateforme.

image d'arrière-plan

Des intégrations fluides à vos outils existants

Unity Catalog se coordonne avec vos catalogues de données existants, systèmes de stockage de données et solutions de gouvernance : vous préservez vos investissements précédents tout en créant un modèle de gouvernance à l’épreuve du temps, sans les coûts élevés d'une migration.

Données et stockage cloud

Gouvernance des données et partenaires de catalogue

Clients


logo couleur compass
« Unity Catalog nous a aidés à simplifier la gestion des données et les contrôles d'accès dans toute l'entreprise. L'équipe chargée des données de Compass a intégré en toute sécurité plus de 100 sources de données, migré tous les espaces de travail vers Unity Catalog et créé une couche d'or dans laquelle les principales parties prenantes peuvent puiser pour obtenir des informations sur des domaines tels que les clients, les produits, l'utilisation, les revenus et bien plus encore - créant ainsi une source unique de vérité, avec des contrôles d'accès complets dans toute l'entreprise."
Rajesh Nagpal, directeur principal de l'ingénierie des données

logo graphique grammarly
« Unity Catalog a considérablement simplifié notre mise en place du contrôle d’accès basé sur les rôles. Nous avons désormais la possibilité de sécuriser les données au niveau du catalogue, de la base de données, de la table et de la colonne. Nous provisionnons de manière transparente le niveau d’accès approprié à tous les utilisateurs. Nous avons la possibilité de conformer la gestion et la sécurisation de l'accès aux données à nos politiques strictes de conformité et de confidentialité, en toute confiance. »
— Chris Locklin, Responsable de l'ingénierie des plateformes de données, Grammarly

logo graphique milliman
« En adoptant Unity Catalog, Milliman a pu tisser un lien direct entre ses vastes assets de données et ses utilisateurs, grâce à une gestion simplifiée des accès et une réduction de la complexité du stockage. Unity Catalog permet à Milliman de disposer d'une capacité d'exploration collaborative des données et d'un stockage rationalisé, tout en respectant les normes strictes du secteur de la santé. Avec Unity Catalog, nous pouvons évoluer rapidement en fonction des besoins de nos clients. »
— Dan McCurley, Architecte de solutions cloud, Milliman

logo couleur rivian
" Unity Catalog nous permet de construire une plateforme de nouvelle génération qui libère tout le potentiel des véhicules définis par logiciel qui évoluent et s'améliorent au fur et à mesure qu'ils accumulent des kilomètres - améliorant ainsi l'expérience de conduite des clients et maximisant les avantages environnementaux du transport électrifié. Nous disposons désormais d'un catalogue de données centralisé et d'une gestion de l'accès à travers diverses équipes et espaces de travail, ce qui a ouvert des possibilités de collaboration et d'innovation sans précédent."
CAS Venkat Sivasubramanian, directeur principal du Big Data

logo graphique warner bros
« Unity Catalog a vraiment changé la donne pour nous. Nos analystes peuvent accéder aux tables externes AWS en temps réel dans les espace de travail de Databricks et les joindre aux tables Delta Lake. Nous profitons ainsi des avantages de performance offerts par Databricks SQL sans faire migrer nos tables Glue. Avec Unity Catalog, différentes équipes peuvent collaborer sans devoir constamment changer les données de place. »
— Rajat Gupta, Responsable de l'ingénierie, Warner Bros. Discovery

Prêt à vous
lancer ?