Unity AI Gateway, Glossaire, adressabilité multi-cloud et multi-région, Hub de gouvernance et bien plus encore
Les nouveautés de Unity Catalog en un coup d'œil :
*Gouvernez ce que font les agents AI, pas seulement ce à quoi ils accèdent : Unity AI Gateway rassemble les modèles, les agents, les outils et les MCP sous une seule couche de gouvernance du runtime.
*Donnez aux agents le contexte métier dont ils ont besoin : Glossaire et Domaines créent une source de signification partagée et gouvernée pour les personnes et les agents.
*Gouvernez l'ensemble de votre patrimoine sur tous les clouds et toutes les régions : un seul catalogue, un ensemble unique de politiques et une gouvernance cohérente partout où vos charges de travail s'exécutent.
L'ère des agents est arrivée. Des centaines de milliers d'agents agissent désormais sur les données de l'entreprise, les interrogent, raisonnent à leur sujet et prennent des décisions en temps réel. Ce changement a modifi é nos attentes vis-à-vis du catalogue. Le catalogue est passé d'un système d'enregistrement à un décideur au moment de l'exécution pour l'IA.
Prendre ces décisions nécessite trois éléments : le contrôle, pour que chaque action, humaine ou d'agent, reste gouvernée ; le contexte, pour que les agents comprennent l'entreprise et cessent d'halluciner ; et le choix, pour que vous ne soyez jamais bloqué dans un seul cloud, modèle ou format. Ensemble, voilà ce que doit signifier la gouvernance à l'ère des agents.
Il y a cinq ans, Databricks a fait figure de pionnier dans la gouvernance des données et de l'IA en lançant Unity Catalog, la seule solution de gouvernance unifiée du secteur pour les données et l'IA sur l'ensemble des clouds, des formats de données et des plateformes de données. Plus de 14 000 organisations gouvernent désormais leurs données et leur IA sur Unity Catalog.
Aujourd'hui, nous faisons progresser Unity Catalog pour répondre à ces trois exigences : contrôle, contexte et choix. Voici les nouveautés.
Pendant des années, gouverner un actif signifiait gouverner l'accès : qui peut interroger cette table, qui peut appeler ce modèle. Mais les agents ne se contentent pas d'accéder aux actifs ; ils agissent à travers eux, en appelant des modèles, en invoquant des outils et en se connectant à des serveurs MCP. Pour répondre à cette évolution, nous introduisons une suite de fonctionnalités conçues pour gouverner l'ensemble du cycle de vie du comportement d'un agent.
Unity AI Gateway est notre solution de gouvernance pour l'IA d'entreprise. Intégré à Unity Catalog, il étend la gouvernance au-delà des actifs de données et d'IA aux interactions au moment de l'exécution entre les modèles, les agents, les MCP, les compétences et les outils :

Lire l'annonce complète sur la gouvernance de l'IA.
Governance Hub, actuellement en PrPr, fournit un centre de commandement centralisé permettant aux gestionnaires de données et aux administrateurs de gouverner votre environnement Databricks : surveillez votre posture, identifiez les risques, hiérarchisez les corrections et faites évoluer les opérations de gouvernance sur les données, l'IA, les coûts et les performances à partir d'une expérience unique.

Récemment, nous avons annoncé la disponibilité générale des politiques ABAC pour le filtrage des lignes et le masquage des colonnes, ainsi que les balises gouvernées et la classification des données, afin de vous aider à protéger les données sensibles à grande échelle.
Lors du Data + AI Summit, nous étendons ABAC avec :
Le contrôle d'accès basé sur les rôles (Public Preview bientôt disponible) complète le modèle collaboratif d'identité et d'autorisation basé sur l'héritage de Databricks en permettant aux clients de définir des groupes qui se comportent comme des rôles. Un rôle est simplement un groupe doté d'un ensemble d'autorisations que les utilisateurs peuvent endosser. Lorsqu'un utilisateur endosse un rôle, il agit en tant que tel, et toutes les actions, y compris l'accès aux données, sont autorisées sous ce rôle.
Le RBAC permet aux clients de modéliser de nouveaux cas d'usage, tels que l'accès exclusif, où les rôles fournissent des limites d'isolation des données pour les projets traitant des données sensibles qui ne doivent pas être consultées de manière combinée (par exemple, les essais cliniques ou les données spécifiques à un pays), ou lors de l'exécution de tâches hautement privilégiées, comme le débogage des problèmes de contrôle d'accès. Les utilisateurs peuvent facilement passer d'un rôle à l'autre dans l'UI, ou en spécifiant un rôle dans les flux OAuth du client, et l'espace de travail s'adapte exactement à ce que ce rôle autorise.
Les agents ne valent que par le contexte dont ils disposent. Sans une définition partagée de ce que l'entreprise signifie réellement, même un agent compétent fera des suppositions. Unity Catalog Semantics fournit aux agents et aux humains une source unique et partagée de signification. Les concepts et les KPI de l'entreprise sont définis une seule fois, organisés par domaine et accessibles via SQL, des API et des MCP, de sorte que n'importe quel outil ou agent peut les utiliser sans verrouillage. Nous étendons maintenant Unity Catalog Semantics avec de nouvelles fonctionnalités pour définir et organiser le contexte.

Le Glossaire vous permet de définir des concepts, des termes et des taxonomies de référence qui aident les agents et les personnes à comprendre votre entreprise, ou d'importer ceux que vous possédez déjà. Les pages du Glossaire se connectent aux données sous-jacentes et entre elles, capturant ainsi les relations. Genie Code rédige de nouvelles pages de Glossaire, suggère des améliorations et signale les définitions qui s'écartent de l'utilisation réelle de vos données, tandis que toute votre équipe les gère ensemble grâce à des suggestions, des commentaires et une appropriation au niveau du domaine. La Preview du Glossaire sera bientôt disponible.

Les domaines, désormais en Public Preview, organisent vos données et vos actifs d'IA en catégories alignées sur l'entreprise, offrant aux agents un contexte ciblé et pertinent plutôt que l'intégralité du catalogue. Les humains parcourent et les agents interrogent les domaines via une place de marché interne, avec des signaux de certification et de gérance indiquant ce qui est fiable. Les suggestions de domaines basées sur l'IA, bientôt disponibles en preview, vous proposent automatiquement des domaines, vous évitant ainsi de devoir tout organiser de zéro.

Cette base sémantique définie par l'utilisateur dans Unity Catalog alimente la Genie Ontology, une couche de contexte d'entreprise continuellement apprise dans la plateforme Databricks. En savoir plus sur la Genie Ontology dans cet article de blog d'annonce.
Les métriques dans Unity Catalog vous permettent de définir vos KPI d'entreprise tels que le chiffre d'affaires, l'attrition (churn), les utilisateurs actifs, la marge, une seule fois sous forme d'objets gouvernés et réutilisables, puis de les interroger de manière cohérente à partir de SQL, d'outils de BI, d'API et d'agents. Nous élargissons considérablement ce que vous pouvez modéliser et la manière dont vous le créez :
Les métriques sont également ouvertes : elles sont open source, disponibles dans Apache Spark et Unity Catalog OSS, et prêtes pour l'Open Semantic Interchange (OSI).
Le lignage externe, désormais généralement disponible, étend le lignage dans Unity Catalog aux actifs au-delà de Databricks. Vous pouvez enregistrer des systèmes sources en amont et des rapports BI en aval afin qu'un seul graphique de lignage couvre l'intégralité de votre flux de données de bout en bout. Dans le cadre de cette version, les pipelines d'ingestion gérés Lakeflow Connect enregistrent automatiquement le lignage des tables sources vers leurs tables de destination dans Unity Catalog. Cela donne aux agents une image plus complète de la provenance de vos données et de leur déplacement, afin qu'ils puissent raisonner de manière plus fiable.

Table Insights dans Unity Catalog inclut désormais un nouveau signal dérivé : la popularité au niveau des colonnes. Depuis la page de présentation d'une table dans le Catalog Explorer, vous pouvez voir la popularité relative de chaque colonne, mesurée par le nombre de requêtes historiques sur la table qui l'ont lue. Ce signal alimente également la Genie Ontology, lui donnant une perception plus précise des colonnes qui importent le plus lors du raisonnement sur vos tables.

À l'ère agentique, vous ne pouvez pas vous permettre d'être enfermé. La puissance de calcul est rare, les modèles évoluent rapidement et vos données s'étendent sur plusieurs clouds, régions et formats. Votre infrastructure doit s'adapter à tout cela, afin que vous puissiez exécuter vos tâches là où la capacité existe, conserver les données dans la bonne région, travailler sur différents formats et adopter de nouveaux modèles à mesure qu'ils arrivent, le tout sans changer de plateforme. Nous annonçons plusieurs nouvelles fonctionnalités pour concrétiser cela.
Unity Catalog étend désormais la gouvernance à l'ensemble de l'empreinte Databricks d'un client, englobant les comptes, les régions et les clouds. Un nouvel espace de noms à quatre niveaux (metastore.catalog.schema.table) attribue à chaque actif une adresse unique sur l'ensemble du patrimoine, offrant aux clients une expérience de découverte unifiée, un ensemble de politiques d'accès appliquées de manière cohérente, une piste d'audit unique et un lignage au niveau des colonnes de bout en bout.
La gouvernance multi-région sera bientôt disponible en preview. La gouvernance multi-cloud et multi-compte suivra. Vous pouvez migrer vos charges de travail Databricks vers le cloud et la région qui disposent de la capacité, des GPU ou de la proximité appropriés avec vos données, et la gouvernance reste cohérente partout où ces charges de travail s'exécutent.
La reprise après sinistre gérée offre aux clients une résilience pour leurs charges de travail critiques. Elle vous permet de répliquer les parties critiques de votre déploiement Databricks vers une région secondaire et d'y basculer en quelques minutes en cas de sinistre. La reprise après sinistre gérée nécessite le nouveau module complémentaire Mission Critical, qui débloque à la fois la reprise après sinistre gérée et nos fonctionnalités existantes de sécurité et de conformité améliorées (Enhanced Security and Compliance).
Unity Catalog est le catalogue le plus complet et le plus ouvert des écosystèmes Delta Lake et Apache Iceberg, avec des avancées récentes incluant Iceberg v3 GA, Managed Iceberg GA, de nouveaux connecteurs de fédération et l'ABAC multi-moteur. Au Data + AI Summit, nous allons encore plus loin :
Il y a cinq ans, nous avons été pionniers du partage ouvert et de la collaboration avec le protocole Delta Sharing - c'est aujourd'hui le protocole ouvert le plus largement adopté pour le partage sécurisé de données sans copie (zero-copy), utilisé par des milliers d'entreprises. Sur la lancée de cette dynamique, la semaine dernière, nous avons annoncé OpenSharing, la prochaine évolution de Delta Sharing. OpenSharing, désormais un projet de la Linux Foundation, introduit le premier protocole ouvert et neutre vis-à-vis des fournisseurs pour partager en toute sécurité des actifs d'IA, y compris des compétences d'agent (Agent Skills), des modèles d'IA et des données non structurées.
Nous annonçons aujourd'hui plusieurs fonctionnalités pour permettre la collaboration :
Unity Catalog continue d'évoluer en tant que seule couche de gouvernance unifiée du secteur, constituant le fondement de plateformes de données sécurisées, intelligentes et adaptées aux besoins de l'entreprise. Que vous conceviez des agents d'IA, déployiez des tableaux de bord de BI ou partagiez des données entre organisations, Unity Catalog connecte l'ensemble de ces éléments via un catalogue unique et ouvert.
Pour démarrer, suivez les guides Unity Catalog pour AWS, Azure, et GCP.
Inscrivez-vous au Data + AI Summit et découvrez nos sessions sur la gouvernance et la sécurité.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.