Revenir au contenu principal
AI Engineering

Présentation d'Omnigent : un méta-harnais pour combiner, contrôler et partager vos agents

par Matei Zaharia et Kasey Uhlenhuth

  • Les harnais d'agents ont rendu les modèles interchangeables. Nous pensons que la prochaine couche d'abstraction est le méta-harnais, la couche supérieure à chaque harnais où résident la composition, le contrôle et la collaboration.
  • Omnigent est notre méta-harnais open source : une interface unifiée pour Claude Code, Codex, Pi et vos propres agents personnalisés, avec chaque session accessible depuis le terminal, le web, le bureau et votre téléphone.
  • Créez des équipes d'agents qui combinent différents harnais et modèles, contrôlez-les à l'aide de politiques plutôt que de prompts, et partagez des sessions en direct avec vos collaborateurs au lieu de faire des copier-coller entre les outils.

Chez Databricks, nous utilisons et concevons des agents de manière intensive, qu'il s'agisse de coder avec eux à grande échelle ou de lancer des produits d'agents comme Genie. Pourtant, même si les capacités des agents se sont considérablement améliorées, leur utilisation reste laborieuse. En tant qu'utilisateurs, nous avons souvent 4 ou 5 agents ouverts en même temps (agents de codage, recherche Gemini, etc.) et nous passons notre temps à copier-coller du texte entre eux et Docs, Slack ou d'autres outils de collaboration. Et en tant que concepteurs d'agents, nous courons sans cesse après l'amélioration de nos agents en combinant les derniers harnais, SDK et modèles. Le problème est que les capacités des LLM sont enveloppées dans un harnais d'agent, et ces harnais possèdent des interfaces différentes qui rendent leur combinaison ou leur remplacement difficile.

C'est pourquoi nous avons créé Omnigent : un méta-harnais qui se superpose aux agents que vous utilisez déjà (Claude Code, Codex, Pi ou des agents personnalisés) et en fait des composants interopérables d'un système plus riche. Omnigent s'attaque aux limites d'un harnais unique : il permet d'assembler facilement plusieurs agents, de les contrôler grâce à des politiques avancées et de collaborer en direct avec ses collègues.

Nous pensons que les utilisateurs travailleront bientôt avec des agents via cette nouvelle couche, le méta-harnais. C'est pourquoi nous publions aujourd'hui Omnigent en open source sous licence Apache 2.0.

Architecture d'Omnigent : un exécuteur (runner) enveloppe n'importe quel agent dans une session isolée (sandbox) dotée d'une API uniforme. Un serveur fournit des politiques et des fonctionnalités de partage, et expose chaque session via le terminal, l'application et des API web.

Pourquoi concevoir un méta-harnais ?

Chez Databricks, nous avons adopté très tôt les agents de codage au sein de notre équipe d'ingénierie de plus de 5 000 membres, et nous avons conçu des milliers d'agents pour nos clients. Cette expérience nous a convaincus que l'ingénierie des agents franchit un nouveau palier. Les meilleurs résultats ne proviennent plus d'un modèle unique dans un harnais unique : Harvey a surpassé un modèle de pointe en termes de qualité et de coût en associant à un modèle d'exécution open source un conseiller de pointe qu'il peut solliciter, Anthropic a conçu son produit de recherche sous la forme d'un agent principal orchestrant des sous-agents parallèles, et notre propre solution Genie utilise différents LLM pour la planification, la recherche et la génération de code. Les ingénieurs adaptent également leur façon de travailler : au lieu de solliciter un seul agent à la fois, ils conçoivent des boucles qui pilotent des équipes entières d'agents.

Ces schémas s'étendent sur plusieurs harnais, modèles et personnes, mais chaque harnais ne comprend que ses propres sessions. Pour combiner les agents, les gouverner et collaborer dessus avec d'autres personnes, vous avez besoin d'une couche supérieure au harnais. Omnigent est cette couche, et elle offre :

  • Composition. Combinez plusieurs modèles, harnais et techniques sans réécrire de code, et passez de Claude Code, Codex, Pi à vos propres agents avec de simples modifications d'une seule ligne.
  • Contrôle. Des politiques contextuelles et persistantes (stateful) qui suivent les actions des agents et appliquent des garde-fous, tels que des budgets de coûts et des autorisations, au niveau du méta-harnais, et non via des prompts.
  • Collaboration. Partagez des sessions d'agents en direct via une URL et examinez des fichiers ensemble, afin que vos collaborateurs puissent réviser, commenter et guider les agents conjointement et en temps réel.

Comment fonctionne Omnigent

Omnigent introduit une interface commune au-dessus des agents en ligne de commande et des SDK d'agents pour vous permettre de les combiner et de les interchanger facilement, puis se concentre sur les problèmes partagés là où un harnais s'arrête. L'idée clé est que, quelle que soit la manière dont chaque harnais d'agent appelle son LLM en interne, l'interface utilisateur reste la même : des messages et des fichiers en entrée, des flux de texte et des appels d'outils en sortie.

En plus de cette interface, la version actuelle d'Omnigent ajoute les fonctionnalités clés suivantes :

  • Collaboration en temps réel : vous pouvez inviter d'autres personnes à visualiser la session de votre agent, à commenter des fichiers dans son espace de travail ou même à envoyer des commandes, faisant ainsi de vos sessions et répertoires de travail le lieu principal de votre collaboration.
  • Plusieurs interfaces pour un même agent : une fois que vous connectez un agent tel que Claude Code au serveur Omnigent, vous pouvez y accéder sur le web, sur mobile, via l'application native Mac OS ou par des API.
  • Exécution dans le cloud : lancez n'importe quel agent sur votre propre machine ou chez des fournisseurs de sandbox hébergées comme Modal et Daytona, pour une collaboration sécurisée dans un environnement hermétique.
  • Politiques de sécurité contextuelles : les politiques de sécurité d'Omnigent vont au-delà du simple « autoriser X / refuser Y » des agents de codage, afin de suivre l'état dynamique de chaque session et de prendre des décisions plus intelligentes. Par exemple, vous pouvez spécifier qu'après le téléchargement d'un nouveau package depuis npm par un agent, une approbation humaine soit requise pour effectuer un git push, ou qu'il ne puisse écrire que dans les documents qu'il a lui-même créés.
  • Politiques de coûts : l'un des éléments que nous suivons de manière dynamique est le coût en LLM de chaque session. Par exemple, vous pouvez demander à Omnigent de suspendre un agent et de solliciter une autorisation de continuer tous les 100 $ dépensés.
  • Sandbox OS robuste : dans Omnigent, nous intégrons une sandbox OS flexible conçue par notre équipe de sécurité, offrant la possibilité de verrouiller de manière souple l'accès au système d'exploitation ainsi que d'intercepter et de transformer les requêtes réseau réseau (par exemple, pour éviter qu'un agent ne voie jamais votre jeton de sécurité GitHub, mais plutôt pour l'injecter uniquement dans le proxy de sortie lors de requêtes approuvées).
  • Création multi-harnais : définissez un agent personnalisé au format YAML et portez-le sur différents harnais grâce à une modification d'une seule ligne, ou combinez des sous-agents utilisant différents harnais au sein du même agent.

Ces fonctionnalités ne font qu'effleurer le potentiel de ce qui est réalisable au niveau de la couche de méta-harnais, et nous nous attendons à voir émerger rapidement de nombreuses autres idées de la part de notre équipe et de la communauté open source. Certains éléments de notre feuille de route incluent l'optimisation automatique au niveau du méta-harnais avec GEPA, l'introspection basée sur le code au sein des agents similaire à MemEx et RLM, un MCP Omnigent Server pour que les agents puissent fonctionner à travers vos sessions, ainsi que d'autres harnais. Nous avons également veillé à ce qu'Omnigent soit facile à déployer sur un large éventail d'infrastructures, notamment les sandbox Fly.io, Railway, Modal et Daytona, ainsi que de nombreux fournisseurs de LLM, et nous accueillons avec plaisir les contributions pour de nouvelles intégrations.

Un méta-harnais pour combiner, contrôler et partager vos agents

Une nouvelle couche pour travailler avec des agents

Bon nombre des transitions les plus importantes de notre secteur ont découlé de l'adoption d'une nouvelle couche d'abstraction : par exemple, alors que les ingénieurs géraient auparavant des processus et des serveurs individuels, ils peuvent désormais piloter un parc entier via des systèmes cloud comme Kubernetes et Terraform.

We think agents are at the same point today. Chaque harnais constitue son propre silo, avec son propre contexte, ses propres contrôles et son propre mode de fonctionnement, et rien de tout cela n'est transféré lorsque vous changez d'outil. De plus, de nombreux défis dépassent intrinsèquement le cadre d'un seul harnais, notamment la composition, la sécurité et la collaboration. Un méta-harnais élève votre travail au-dessus de tout harnais individuel, de sorte que vos sessions, vos politiques et vos compétences vous accompagnent, quel que soit l'agent ou le modèle utilisé. Les modèles et les harnais continueront d'évoluer à mesure que le domaine progresse ; la couche sur laquelle vous travaillez ne devrait pas avoir à le faire.

Nous construisons cette couche de manière ouverte, et nous serions ravis que vous la bâtissiez avec nous.

Essayez-le

Omnigent est disponible en open source en version alpha dès aujourd'hui.

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.