Revenir au contenu principal
Annonces

Agent Bricks : Data + AI Summit 2026

par Hanlin Tang, Kasey Uhlenhuth, Akhil Gupta et Patrick Wendell

L'année dernière, lors du Data + AI Summit, nous avons lancé Agent Bricks, ouvrant la voie à une nouvelle façon de créer des agents de haute qualité capables de raisonner sur vos données. Depuis son lancement, plus de 100 000 agents ont été créés, et nous traitons désormais plus d'un quadrillion de tokens par an pour ces agents. Des clients tels qu'AstraZeneca, 7-Eleven, Fox Corporation et Block ont déployé des agents basés sur Agent Bricks. Cette année, au DAIS 2026, nous sommes ravis d'annoncer l'expansion d'Agent Bricks en tant que plateforme d'agents complète pour les développeurs.

Les 99 % manquants

L'essor du codage agentique, associé à des modèles frontières plus puissants, a déclenché une explosion cambrienne d'agents. Créer des agents avec les nombreux frameworks ou structures d'agents de l'écosystème n'a jamais été aussi simple. Cependant, au cours de l'année écoulée, nous avons appris que la boucle principale de l'agent ne représente que 1 % du travail. Les 99 % restants constituent la dette technique cachée des systèmes agentiques : capacité des tokens, déploiement, sécurité, évaluation, surveillance, contexte, partage (voir la figure ci-dessous).

Plateforme d'agents

Par conséquent, nous avons constaté que les développeurs passaient leur temps à construire des infrastructures plutôt que des agents. Ce moment exige une plateforme d'agents pour les développeurs.

Nous pensons qu'une plateforme d'agents doit résoudre trois défis majeurs :

  1. Le choix. Les agents sont de plus en plus composés de nombreux sous-agents et ont besoin d'une diversité de modèles pour trouver le bon équilibre entre qualité et latence. Chaque famille de modèles présente des comportements uniques et surpasse constamment les autres à chaque nouvelle version. Les développeurs ont besoin d'un large choix de modèles, allant des modèles propriétaires et open source les plus avancés aux modèles plus petits, économiques et rapides, en passant par des modèles personnalisés sur les données uniques de leur entreprise.
  2. Le contexte. Les LLM sont de puissantes machines de raisonnement, mais ils doivent être capables de récupérer et de traiter le bon contexte afin de prendre des décisions adaptées à l'entreprise. C'est un problème extrêmement difficile, car le patrimoine de données est parsemé d'informations manquantes ou trompeuses, ou bien le contexte nécessaire ne se trouve que chez certaines personnes ou doit être reconstitué à partir de plusieurs sources.
  3. Le contrôle. Les agents font partie des acteurs les plus privilégiés d'une entreprise, avec un accès à des données sensibles. L'actualité regorge d'exemples d'agents supprimant accidentellement des bases de code, ou subissant des injections de requêtes pour divulguer des informations précieuses. Et les coûts explosent avec des employés qui maximisent l'utilisation des tokens (« tokenmaxing ») pour grimper dans les classements de codage agentique. Les développeurs ont besoin de moyens pour déployer des agents en toute sécurité et pour contrôler les coûts afin que l'entreprise puisse se permettre de déployer des agents à grande échelle.

Construire une plateforme d'agents qui relève ces défis nécessite de connecter les données à l'AI. Après tout, les agents ne se contentent pas de consommer des données via des outils et du contexte, ils produisent désormais également de nombreuses données dans leurs résultats, leurs actions, leurs traces de raisonnement et leur mémoire, qui doivent toutes être gouvernées et analysées. Cette unification des données et de l'AI est une prouesse pour laquelle Databricks est idéalement positionné.

Agent Bricks

Nous sommes extrêmement ravis d'annoncer la prochaine évolution d'Agent Bricks en tant que plateforme d'agents pour les développeurs. Ce qui a commencé comme une expérience de création d'agents s'est transformé en une plateforme complète permettant aux développeurs de concevoir des agents avec n'importe quel modèle et n'importe quelle structure, d'accéder aux données n'importe où, et de les déployer et de les contrôler en toute confiance. Nous disposons de toutes les briques de base, des bacs à sable sécurisés à la mémoire des agents, en passant par la capacité de tokens pour les développeurs : Databricks gère l'infrastructure pendant que vous créez des agents à fort impact.

Le choix

Modèles

Agent Bricks propose tous les modèles propriétaires et open source les plus avancés sur une seule plateforme, intégrés nativement dans notre périmètre de sécurité. Passez facilement d'un LLM à un autre et testez-les pour équilibrer le comportement de l'agent avec la latence et le coût. En plus d'OpenAI, Anthropic, Gemini et Qwen, nous venons d'ajouter le support pour Kimi. Nous sommes également ravis d'annoncer un partenariat avec SpaceX pour rendre les modèles Grok disponibles nativement sur Databricks.

« Databricks nous offre une base sécurisée et gouvernée pour exécuter plusieurs modèles et changer de fournisseur à mesure que nos besoins évoluent. Tout cela en maîtrisant les coûts. » — Gregory Rokita, VP of Technology, Edmunds

Depuis trois ans, nous sommes pionniers dans les modèles personnalisés : des clients créent des modèles spécialisés sur les données de leur entreprise grâce à l' optimisation des requêtes, au fine-tuning, ou à l' apprentissage par renforcement. Notre équipe de recherche entraîne régulièrement des modèles personnalisés, allant de petits modèles pour des tâches de sous-agents à l'application du RL à de grands modèles en tant que modèle agentique principal. Récemment, nous avons utilisé l'apprentissage par renforcement pour entraîner un agent de données personnalisé qui est compétitif avec des modèles de pointe tels qu'Opus et Sonnet pour les tâches liées à Genie, tout en offrant un coût par requête nettement inférieur (voir la figure ci-dessous). Désormais, des clients tels que Merck ou First American utilisent AI Runtime pour entraîner des LLM spécialisés sur leurs données uniques.

Figure : Performances sur un benchmark interne de Genie, montrant que notre modèle personnalisé Databricks (en rouge) est à la fois de meilleure qualité et moins coûteux que les modèles Opus et Sonnet. Ici, un coût inférieur se situe vers la droite de l'axe.

Structures d'intégration d'agents

Nous prenons en charge toutes les structures d'intégration d'agents que les développeurs souhaitent utiliser, des frameworks open source tels que LangGraph, Agno et CrewAI aux structures telles que Claude Code SDK ou les SDK d'agents d'OpenAI. Déployez ces agents avec une mise à l'échelle automatique horizontale vers Databricks Apps. Nous proposons également une version managée de notre méta-structure open source Omnigent, que nous avons publiée le week-end dernier, pour orchestrer différentes structures.

Déployez des agents personnalisés avec Databricks Apps

Le contexte

La récupération des bonnes données ne se limite plus aux applications RAG d'autrefois. Les agents disposent désormais d'outils sophistiqués pour rechercher, récupérer et manipuler des données lors du raisonnement afin d'identifier le contexte pertinent. Pourtant, les exigences des capacités actuelles des agents nécessitent de parcourir un paysage de données complexe et désordonné, composé de tables obsolètes, de dossiers Google Drive non organisés, de pages de recherche web confuses et de documents trompeurs. Souvent, le contexte requis n'est tout simplement pas enregistré, n'existant que dans l'esprit de quelques personnes clés. L'essor du contenu de mauvaise qualité généré par l'AI (« AI slop ») pollue encore davantage le patrimoine de données avec des « faits » difficiles à vérifier.

Notre équipe de recherche résout des problèmes critiques dans ce domaine, tels que la recherche agentique, la mise à l'échelle de la mémoire, les blocs-notes programmables, l'évaluation, et le raisonnement fondé. Dans le cadre d'Agent Bricks, ces innovations sont fournies dans quelques composants clés :

  • Connecter les agents aux données partout

En ajoutant la prise en charge de MCP à Unity Catalog, les agents d'Agent Bricks peuvent se connecter en toute sécurité à des sources de données externes telles que Google Drive, JIRA, Slack, GitHub, etc. Nos agents de recherche spécialisés sont capables d'exploiter à la fois les métadonnées structurées et le texte source pour trouver efficacement les bonnes informations.

  • Ontologie Genie

En apprenant continuellement une ontologie sur les données et en intégrant la sémantique métier annotée par l'humain, l'Ontologie Genie permet à Agent Bricks d'accéder à une mine d'informations pour guider la recherche et l'analyse. Quand commence l'exercice fiscal ? Qui est le responsable des ventes ? Que signifie un client perdu pour mon entreprise ? Quelle est notre stratégie cette année ? Quelle table est la plus utilisée ? Quel auteur de données possède l'historique le plus fiable ? L'Ontologie Genie permet aux agents de comprendre instantanément votre entreprise dès le départ, sans avoir à recréer le contexte à chaque appel.

  • Outils d'agent Databricks

Nous avons lancé une suite d'outils intégrés gérés par Databricks qui exploitent nos innovations en matière de recherche pour offrir la meilleure recherche de données de sa catégorie sur le Lakehouse, ainsi que sur les données externes via des MCP. Par exemple, nos travaux sur la recherche agentique ont permis de créer un sous-agent de recherche de documents désormais 3 fois plus rapide qu'auparavant, tout en améliorant la qualité. Ces outils sont accessibles et gouvernés de manière centralisée dans Unity Catalog.

  • Service de mémoire d'agent

Les développeurs qui conçoivent des agents peuvent désormais connecter leurs agents à une mémoire gérée sur Databricks. S'appuyant sur Lakebase en arrière-plan, les agents peuvent gérer leur propre contexte, l'historique de leurs sessions et les conserver d'une session à l'autre, et à terme, d'un agent à l'autre.

  • Intelligence documentaire

Depuis notre lancement l'année dernière, un ensemble de fonctions SQL que nous appelons Document Intelligence (GA) permet l'analyse syntaxique et l'analyse de pointe des PDF et autres documents. Avec ai_parse_document, ai_extract et ai_classify, la création de workflows de traitement de documents ou de sous-agents est simple. Selon notre benchmark interne des tâches d'analyse de documents d'entreprise, notre système offre à la fois la meilleure qualité et le coût le plus bas par rapport aux LLM de pointe et aux systèmes spécialisés d'autres fournisseurs.

  • Databricks Sandbox

Accéder au contexte en toute sécurité nécessite une isolation rigoureuse et une définition précise de la portée des accès. Databricks Sandbox permet de lancer des VM sécurisées pour le calcul, avec un accès restreint aux données dans Unity Catalog. Ces bacs à sable peuvent être utilisés pour héberger des outils d'interprétation de code, exécuter des sous-agents et des environnements de test, ou simplement comme un espace de brouillon sécurisé pour l'expérimentation d'agents.

Contrôle

L'explosion cambrienne des agents, modèles et outils nécessite une force de gouvernance tout aussi puissante pour déployer ces agents en toute sécurité et en maîtriser les coûts. Nous sommes ravis d'annoncer Unity AI Gateway, une couche de gouvernance unifiée pour tous vos actifs d'IA, qu'ils soient sur Databricks ou hébergés en externe. Chaque client devrait utiliser Unity AI Gateway pour sécuriser, observer et gouverner ses actifs d'IA, des MCP aux modèles en passant par les agents externes.

Nous avons implémenté les fonctionnalités clés d'une plateforme de gouvernance dans Unity AI Gateway :

  • Découvrir un catalogue de tous les agents, modèles, MCP, compétences (Skills) et agents externes
  • Configurer des contrôles d'accès précis pour les outils et les agents
  • Suivre les coûts et imposer des budgets par utilisateur et par groupe
  • Router intelligemment le trafic en fonction de la fiabilité, des politiques budgétaires ou d'autres contrôles

Mais il existe quelques fonctionnalités critiques que seule une plateforme combinant données et IA comme Databricks peut offrir :

Traces et surveillance des agents

Les agents génèrent de grandes quantités de données à partir de leurs traces de raisonnement, de leurs écritures en mémoire et de leurs générations. Ces données doivent être gouvernées dans le Lakehouse aux côtés du reste de vos données, et non cloisonnées chez un autre fournisseur. Les avantages ne s'arrêtent pas là : maintenant que les données sont dans le Lakehouse, vous pouvez appliquer toute la puissance de Databricks pour analyser ces traces, déboguer la qualité des agents, analyser et optimiser les sessions de codage IA, et surveiller le comportement en production. Désormais intégré à LakeWatch, notre plateforme de sécurité agentique, configurez des alertes pour les violations de PII, auditez l'accès aux données sensibles et répondez aux incidents de sécurité.

Politiques contextuelles

Les agents ont un état (stateful), sont dynamiques et contextuels ; les politiques de sécurité qui les régissent doivent donc l'être également. Créez des politiques de sécurité personnalisées pour les outils, des garde-fous (guardrails) pour les agents, directement en SQL (et bientôt en Python). Surtout, ces politiques peuvent conserver un état et réagir en fonction des données et du contexte.

Par exemple, dans l'illustration ci-dessous, vous pouvez rédiger une politique de sorte que, si un agent accède à des données client sensibles contenant des PII, il lui soit interdit de publier ces données sur un site web d'entreprise, mais qu'il puisse les envoyer par e-mail à un collègue. D'autres actions, comme la mise à jour de Salesforce, nécessiteraient une approbation humaine.

Registre Unity Catalog pour les agents, les outils et les modèles

Nous avons ajouté les agents, les outils et les modèles à Unity Catalog (UC), afin que vous puissiez gouverner ces actifs aux côtés du reste de votre patrimoine de données. La gouvernance de l'IA ne peut être séparée de la gouvernance des données. Les agents, les modèles et les outils fonctionnent en fin de compte sur les données de l'entreprise. Gouverner ensemble les données et l'IA offre des politiques cohérentes, une visibilité de bout en bout et un plan de contrôle unique pour la sécurité, la conformité et l'audit.

Pour un aperçu complet de la gouvernance de l'IA, consultez le blog sur Unity AI Gateway.

Nous sommes ravis d'annoncer Agent Bricks comme notre plateforme d'agents complète. Nous pensons que l'avenir des agents passe par la combinaison des données et de l'IA au sein d'une plateforme unique, afin que les développeurs puissent facilement créer et exploiter des agents en production. En offrant le choix du modèle, un contexte pertinent et une gouvernance complète, Agent Bricks est prêt pour concevoir votre application agentique. Nous avons hâte de voir ce que vous allez créer.

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.