Revenir au contenu principal
Annonces

Les nouveautés d'Unity Catalog au Data + AI Summit 2026

Unity AI Gateway, Glossaire, adressabilité multi-cloud et multi-région, Hub de gouvernance et bien plus encore

par The Unity Catalog Product and Engineering Team

Les nouveautés de Unity Catalog en un coup d'œil :
*Gouvernez ce que font les agents AI, pas seulement ce à quoi ils accèdent : Unity AI Gateway rassemble les modèles, les agents, les outils et les MCP sous une seule couche de gouvernance du runtime.
*Donnez aux agents le contexte métier dont ils ont besoin : Glossaire et Domaines créent une source de signification partagée et gouvernée pour les personnes et les agents.
*Gouvernez l'ensemble de votre patrimoine sur tous les clouds et toutes les régions : un seul catalogue, un ensemble unique de politiques et une gouvernance cohérente partout où vos charges de travail s'exécutent.

L'ère des agents est arrivée. Des centaines de milliers d'agents agissent désormais sur les données de l'entreprise, les interrogent, raisonnent à leur sujet et prennent des décisions en temps réel. Ce changement a modifié nos attentes vis-à-vis du catalogue. Le catalogue est passé d'un système d'enregistrement à un décideur au moment de l'exécution pour l'IA.

Prendre ces décisions nécessite trois éléments : le contrôle, pour que chaque action, humaine ou d'agent, reste gouvernée ; le contexte, pour que les agents comprennent l'entreprise et cessent d'halluciner ; et le choix, pour que vous ne soyez jamais bloqué dans un seul cloud, modèle ou format. Ensemble, voilà ce que doit signifier la gouvernance à l'ère des agents.

Il y a cinq ans, Databricks a fait figure de pionnier dans la gouvernance des données et de l'IA en lançant Unity Catalog, la seule solution de gouvernance unifiée du secteur pour les données et l'IA sur l'ensemble des clouds, des formats de données et des plateformes de données. Plus de 14 000 organisations gouvernent désormais leurs données et leur IA sur Unity Catalog.

Aujourd'hui, nous faisons progresser Unity Catalog pour répondre à ces trois exigences : contrôle, contexte et choix. Voici les nouveautés.

Contrôle : la gouvernance de l'IA pour tous vos agents

Pendant des années, gouverner un actif signifiait gouverner l'accès : qui peut interroger cette table, qui peut appeler ce modèle. Mais les agents ne se contentent pas d'accéder aux actifs ; ils agissent à travers eux, en appelant des modèles, en invoquant des outils et en se connectant à des serveurs MCP. Pour répondre à cette évolution, nous introduisons une suite de fonctionnalités conçues pour gouverner l'ensemble du cycle de vie du comportement d'un agent.

Unity AI Gateway : gouvernez chaque modèle, outil et agent

Unity AI Gateway est notre solution de gouvernance pour l'IA d'entreprise. Intégré à Unity Catalog, il étend la gouvernance au-delà des actifs de données et d'IA aux interactions au moment de l'exécution entre les modèles, les agents, les MCP, les compétences et les outils :

  • Gouvernez chaque actif d'IA en un seul endroit : Enregistrez et gouvernez les modèles hébergés par Databricks et externes, les services MCP, les agents et les compétences aux côtés de vos données, avec les mêmes contrôles d'accès, découverte, lignage et audit que vous utilisez déjà. Databricks fournit des services de modèles de fondation prêts à l'emploi, ainsi que des services MCP gérés pour des applications telles que Google Drive, Jira, Slack et GitHub.
  • Appliquez ce que l'IA peut faire au moment de l'exécution : les Contextual Service Policies, actuellement en version Beta, étendent la gouvernance : il ne s'agit plus seulement de savoir qui peut accéder à un modèle ou à un outil, mais ce qu'il peut faire lors d'une interaction donnée. Les administrateurs peuvent autoriser, refuser ou exiger une approbation pour des actions telles que l'écriture dans des dossiers sensibles ou le déploiement de code. Des garde-fous intégrés protègent contre l'exposition aux PII, l'injection de prompts et les contenus non sécurisés.
  • Contrôlez les dépenses d'IA chez tous les fournisseurs : les budgets d'AI Gateway couvrent désormais les fournisseurs externes, y compris les connexions de type « bring-your-own-key », afin que vous puissiez visualiser en un seul endroit les dépenses d'IA pour les modèles hébergés par Databricks et externes. Des limites de dépenses strictes bloquent les requêtes lorsqu'un budget est atteint, plutôt que de simplement envoyer une alerte après coup.
  • Surveillez et examinez l'activité de l'IA : le traçage unifié des agents dans Unity AI Gateway capture l'activité des modèles et des MCP dans une couche de télémétrie gouvernée unique, et les traces peuvent être analysées dans Lakewatch, le SIEM natif du lakehouse de Databricks.
Unity AI Gateway

Lire l'annonce complète sur la gouvernance de l'IA.

Governance Hub

Governance Hub, actuellement en PrPr, fournit un centre de commandement centralisé permettant aux gestionnaires de données et aux administrateurs de gouverner votre environnement Databricks : surveillez votre posture, identifiez les risques, hiérarchisez les corrections et faites évoluer les opérations de gouvernance sur les données, l'IA, les coûts et les performances à partir d'une expérience unique.

Governance Hub

Contrôles d'accès basés sur les attributs

Récemment, nous avons annoncé la disponibilité générale des politiques ABAC pour le filtrage des lignes et le masquage des colonnes, ainsi que les balises gouvernées et la classification des données, afin de vous aider à protéger les données sensibles à grande échelle.

Lors du Data + AI Summit, nous étendons ABAC avec :

  • Politiques d'attribution ABAC (Beta pour les modèles) : Définissez l'accès basé sur les attributs une seule fois pour accorder automatiquement les autorisations EXECUTE sur tous les modèles correspondants, éliminant ainsi la surcharge par modèle. La prise en charge future s'étendra à d'autres éléments sécurisables, notamment les composants d'IA (services MCP, agents), les tables et les volumes.
  • Attributs d'identité (bientôt en Preview) : Créez des règles d'accès à l'aide des propriétés utilisateur en temps réel (par exemple, service, région, habilitation) synchronisées depuis votre fournisseur d'identité ou gérées dans Databricks, pour dépasser l'accès rigide basé sur les groupes.
  • Attributs de contexte (bientôt en Preview) : Tirez parti du contexte de la requête, par exemple si l'accès provient d'un agent, d'une application ou d'un espace de travail, pour gérer de manière sécurisée l'accès négocié par l'application et l'agent.
  • Propagation des balises (Private Preview disponible dès maintenant) : Transférez automatiquement les balises gouvernées des tables et colonnes sources vers les tables et vues en aval à mesure que les données sont transformées, afin que vos politiques de classification et d'accès restent cohérentes sans effort manuel.

Contrôles d'accès basés sur les rôles

Le contrôle d'accès basé sur les rôles (Public Preview bientôt disponible) complète le modèle collaboratif d'identité et d'autorisation basé sur l'héritage de Databricks en permettant aux clients de définir des groupes qui se comportent comme des rôles. Un rôle est simplement un groupe doté d'un ensemble d'autorisations que les utilisateurs peuvent endosser. Lorsqu'un utilisateur endosse un rôle, il agit en tant que tel, et toutes les actions, y compris l'accès aux données, sont autorisées sous ce rôle.

Le RBAC permet aux clients de modéliser de nouveaux cas d'usage, tels que l'accès exclusif, où les rôles fournissent des limites d'isolation des données pour les projets traitant des données sensibles qui ne doivent pas être consultées de manière combinée (par exemple, les essais cliniques ou les données spécifiques à un pays), ou lors de l'exécution de tâches hautement privilégiées, comme le débogage des problèmes de contrôle d'accès. Les utilisateurs peuvent facilement passer d'un rôle à l'autre dans l'UI, ou en spécifiant un rôle dans les flux OAuth du client, et l'espace de travail s'adapte exactement à ce que ce rôle autorise.

Contexte : un contexte d'entreprise ouvert et adaptatif

Les agents ne valent que par le contexte dont ils disposent. Sans une définition partagée de ce que l'entreprise signifie réellement, même un agent compétent fera des suppositions. Unity Catalog Semantics fournit aux agents et aux humains une source unique et partagée de signification. Les concepts et les KPI de l'entreprise sont définis une seule fois, organisés par domaine et accessibles via SQL, des API et des MCP, de sorte que n'importe quel outil ou agent peut les utiliser sans verrouillage. Nous étendons maintenant Unity Catalog Semantics avec de nouvelles fonctionnalités pour définir et organiser le contexte.

Unity Catalog Semantics pour le contexte d'entreprise

Glossaire

Le Glossaire vous permet de définir des concepts, des termes et des taxonomies de référence qui aident les agents et les personnes à comprendre votre entreprise, ou d'importer ceux que vous possédez déjà. Les pages du Glossaire se connectent aux données sous-jacentes et entre elles, capturant ainsi les relations. Genie Code rédige de nouvelles pages de Glossaire, suggère des améliorations et signale les définitions qui s'écartent de l'utilisation réelle de vos données, tandis que toute votre équipe les gère ensemble grâce à des suggestions, des commentaires et une appropriation au niveau du domaine. La Preview du Glossaire sera bientôt disponible.

Le Glossaire dans Unity Catalog

Domaines

Les domaines, désormais en Public Preview, organisent vos données et vos actifs d'IA en catégories alignées sur l'entreprise, offrant aux agents un contexte ciblé et pertinent plutôt que l'intégralité du catalogue. Les humains parcourent et les agents interrogent les domaines via une place de marché interne, avec des signaux de certification et de gérance indiquant ce qui est fiable. Les suggestions de domaines basées sur l'IA, bientôt disponibles en preview, vous proposent automatiquement des domaines, vous évitant ainsi de devoir tout organiser de zéro.

Domaines : organisation des données et de l'IA alignée sur l'entreprise

Cette base sémantique définie par l'utilisateur dans Unity Catalog alimente la Genie Ontology, une couche de contexte d'entreprise continuellement apprise dans la plateforme Databricks. En savoir plus sur la Genie Ontology dans cet article de blog d'annonce.

Métriques

Les métriques dans Unity Catalog vous permettent de définir vos KPI d'entreprise tels que le chiffre d'affaires, l'attrition (churn), les utilisateurs actifs, la marge, une seule fois sous forme d'objets gouvernés et réutilisables, puis de les interroger de manière cohérente à partir de SQL, d'outils de BI, d'API et d'agents. Nous élargissons considérablement ce que vous pouvez modéliser et la manière dont vous le créez :

  • Modélisation sémantique plus riche : Allez au-delà des mesures sur table unique avec des relations multi-faits (Public Preview dans les tableaux de bord), des calculs de niveau de détail (LOD) qui s'exécutent à la granularité de votre choix, des métriques paramétrées qui s'adaptent aux entrées d'exécution, et des mesures de fenêtre améliorées pour une analyse comparative d'une période à l'autre plus simple.
  • Création agentique et basée sur l'interface utilisateur : Créez et affinez des modèles de métriques visuellement dans l'UI, ou laissez les agents rédiger et suggérer des définitions pour vous, réduisant ainsi la barrière à la création d'une sémantique bien définie.
  • Requêtes plus rapides grâce à la matérialisation (Public Preview) : Précalculez les résultats des métriques afin que les tableaux de bord et les requêtes des agents s'exécutent plus rapidement, sans modifier la façon dont les métriques sont définies.
  • Importation depuis des outils tiers (Bêta) : Démarrez rapidement à partir des outils que vous utilisez déjà en important des modèles existants depuis Power BI et Tableau directement dans Databricks.

Les métriques sont également ouvertes : elles sont open source, disponibles dans Apache Spark et Unity Catalog OSS, et prêtes pour l'Open Semantic Interchange (OSI).

Lignage externe

Le lignage externe, désormais généralement disponible, étend le lignage dans Unity Catalog aux actifs au-delà de Databricks. Vous pouvez enregistrer des systèmes sources en amont et des rapports BI en aval afin qu'un seul graphique de lignage couvre l'intégralité de votre flux de données de bout en bout. Dans le cadre de cette version, les pipelines d'ingestion gérés Lakeflow Connect enregistrent automatiquement le lignage des tables sources vers leurs tables de destination dans Unity Catalog. Cela donne aux agents une image plus complète de la provenance de vos données et de leur déplacement, afin qu'ils puissent raisonner de manière plus fiable.

Lignage externe

Insights et popularité des tables

Table Insights dans Unity Catalog inclut désormais un nouveau signal dérivé : la popularité au niveau des colonnes. Depuis la page de présentation d'une table dans le Catalog Explorer, vous pouvez voir la popularité relative de chaque colonne, mesurée par le nombre de requêtes historiques sur la table qui l'ont lue. Ce signal alimente également la Genie Ontology, lui donnant une perception plus précise des colonnes qui importent le plus lors du raisonnement sur vos tables.

Table Insights

Le choix : tirer parti d'une infrastructure ouverte pour l'ère agentique

À l'ère agentique, vous ne pouvez pas vous permettre d'être enfermé. La puissance de calcul est rare, les modèles évoluent rapidement et vos données s'étendent sur plusieurs clouds, régions et formats. Votre infrastructure doit s'adapter à tout cela, afin que vous puissiez exécuter vos tâches là où la capacité existe, conserver les données dans la bonne région, travailler sur différents formats et adopter de nouveaux modèles à mesure qu'ils arrivent, le tout sans changer de plateforme. Nous annonçons plusieurs nouvelles fonctionnalités pour concrétiser cela.

Adressabilité multi-cloud et multi-région

Unity Catalog étend désormais la gouvernance à l'ensemble de l'empreinte Databricks d'un client, englobant les comptes, les régions et les clouds. Un nouvel espace de noms à quatre niveaux (metastore.catalog.schema.table) attribue à chaque actif une adresse unique sur l'ensemble du patrimoine, offrant aux clients une expérience de découverte unifiée, un ensemble de politiques d'accès appliquées de manière cohérente, une piste d'audit unique et un lignage au niveau des colonnes de bout en bout.

La gouvernance multi-région sera bientôt disponible en preview. La gouvernance multi-cloud et multi-compte suivra. Vous pouvez migrer vos charges de travail Databricks vers le cloud et la région qui disposent de la capacité, des GPU ou de la proximité appropriés avec vos données, et la gouvernance reste cohérente partout où ces charges de travail s'exécutent.

Reprise après sinistre gérée

La reprise après sinistre gérée offre aux clients une résilience pour leurs charges de travail critiques. Elle vous permet de répliquer les parties critiques de votre déploiement Databricks vers une région secondaire et d'y basculer en quelques minutes en cas de sinistre. La reprise après sinistre gérée nécessite le nouveau module complémentaire Mission Critical, qui débloque à la fois la reprise après sinistre gérée et nos fonctionnalités existantes de sécurité et de conformité améliorées (Enhanced Security and Compliance).

Interopérabilité multi-format et multi-plateforme

Unity Catalog est le catalogue le plus complet et le plus ouvert des écosystèmes Delta Lake et Apache Iceberg, avec des avancées récentes incluant Iceberg v3 GA, Managed Iceberg GA, de nouveaux connecteurs de fédération et l'ABAC multi-moteur. Au Data + AI Summit, nous allons encore plus loin :

  • Accès externe aux tables Delta gérées (Public Preview) : des moteurs externes comme Spark et Flink peuvent désormais créer et écrire dans des tables Delta gérées par Unity Catalog.
  • Données multimodales dans des formats ouverts (Bêta) : un nouveau type FILE permet aux tables gérées Delta et Iceberg de gouverner nativement les données non structurées telles que les PDF, les images, l'audio et la vidéo.
  • Types géospatiaux dans Delta et Iceberg v3 (GA) : prise en charge géospatiale native pour des cas d'usage tels que l'optimisation des itinéraires, l'analyse de flotte et la surveillance des risques géolocalisés.

Écosystème de partage ouvert et de collaboration

Il y a cinq ans, nous avons été pionniers du partage ouvert et de la collaboration avec le protocole Delta Sharing - c'est aujourd'hui le protocole ouvert le plus largement adopté pour le partage sécurisé de données sans copie (zero-copy), utilisé par des milliers d'entreprises. Sur la lancée de cette dynamique, la semaine dernière, nous avons annoncé OpenSharing, la prochaine évolution de Delta Sharing. OpenSharing, désormais un projet de la Linux Foundation, introduit le premier protocole ouvert et neutre vis-à-vis des fournisseurs pour partager en toute sécurité des actifs d'IA, y compris des compétences d'agent (Agent Skills), des modèles d'IA et des données non structurées.

Nous annonçons aujourd'hui plusieurs fonctionnalités pour permettre la collaboration :

  • Partage multi-cloud : SecureConnect est une fonctionnalité unique en son genre qui permet une connectivité sécurisée entre les clouds avec un partage de données sans copie (zero-copy). Global Distribution permet une réplication automatisée entre les clouds et les régions.
  • Collaboration multimodale : Au-delà des données, vous pouvez désormais collaborer sur des actifs d'IA et des applications. Genie Sharing permet une collaboration inter-organisations sur les Genie Agents. les applications tierces (3rd Party Apps) sont également désormais disponibles sur le Databricks Marketplace.

Démarrez avec Unity Catalog

Unity Catalog continue d'évoluer en tant que seule couche de gouvernance unifiée du secteur, constituant le fondement de plateformes de données sécurisées, intelligentes et adaptées aux besoins de l'entreprise. Que vous conceviez des agents d'IA, déployiez des tableaux de bord de BI ou partagiez des données entre organisations, Unity Catalog connecte l'ensemble de ces éléments via un catalogue unique et ouvert.

Pour démarrer, suivez les guides Unity Catalog pour AWS, Azure, et GCP.

Inscrivez-vous au Data + AI Summit et découvrez nos sessions sur la gouvernance et la sécurité.

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.