Ir para o conteúdo principal
AI Engineering

Apresentando o Omnigent: um meta-harness para combinar, controlar e compartilhar seus agentes

por Matei Zaharia e Kasey Uhlenhuth

  • Os harnesses de agentes tornaram os modelos intercambiáveis. Acreditamos que a próxima camada de abstração é o meta-harness, a camada acima de cada harness onde vivem a composição, o controle e a colaboração.
  • O Omnigent é o nosso meta-harness de código aberto: uma interface unificada para o Claude Code, Codex, Pi e seus próprios agentes personalizados, com cada sessão acessível a partir do terminal, web, desktop e celular.
  • Crie equipes de agentes que misturam harnesses e modelos, controle-os com políticas em vez de prompts e compartilhe sessões ao vivo com colegas de equipe em vez de copiar e colar entre ferramentas.

Na Databricks, usamos e criamos agentes extensivamente, desde programar com eles em escala até lançar produtos de agentes como o Genie. Mas, embora os recursos dos agentes tenham melhorado muito, trabalhar com eles ainda parece pouco prático. Como usuários, geralmente temos de 4 a 5 agentes abertos ao mesmo tempo (agentes de codificação, busca do Gemini, etc.) e passamos o tempo copiando e colando texto entre eles e o Docs, Slack e outras ferramentas de colaboração. E, como criadores de agentes, estamos em uma corrida constante para melhorar nossos agentes combinando os frameworks, SDKs e modelos mais recentes. O problema é que os recursos de LLM são empacotados em um framework de agente, e esses frameworks têm interfaces diferentes que dificultam combiná-los ou trocá-los.

Por isso, criamos o Omnigent: um meta-framework que fica acima dos agentes que você já usa (Claude Code, Codex, Pi ou agentes personalizados) e os torna partes interoperáveis de um sistema mais rico. O Omnigent foca nos problemas onde um único framework para: ele adiciona maneiras fáceis de compor múltiplos agentes, controlá-los com políticas avançadas e colaborar ao vivo com colegas de equipe.

Acreditamos que, em breve, as pessoas trabalharão com agentes por meio desta nova camada, o meta-framework. É por isso que hoje estamos disponibilizando o código aberto do Omnigent sob a licença Apache 2.0.

Arquitetura do Omnigent: um executor empacota qualquer agente em uma sessão em sandbox com uma API uniforme. Um servidor fornece políticas e compartilhamento, e expõe cada sessão por meio do terminal, do aplicativo e de APIs web.

Por que criar um meta-framework?

Na Databricks, adotamos agentes de codificação cedo em nossa equipe de engenharia de mais de 5.000 membros e criamos milhares de agentes para clientes. Essa experiência nos convenceu de que a fronteira da engenharia de agentes está subindo de nível. Os melhores resultados não vêm mais de um único modelo em um único framework: o Harvey superou um modelo de fronteira em qualidade e custo ao dar a um modelo executor de código aberto um orientador de fronteira que ele pode acionar, a Anthropic construiu seu produto de pesquisa como um agente líder que orquestra subagentes paralelos, e o nosso próprio Genie usa diferentes LLMs para planejamento, busca e geração de código. Os engenheiros também estão mudando a forma como trabalham: em vez de interagir com um agente por vez por meio de prompts, eles projetam loops que comandam equipes inteiras de agentes.

Esses padrões abrangem múltiplos frameworks, modelos e pessoas, mas cada framework só entende suas próprias sessões. Para combinar agentes, governá-los e trabalhar neles com outras pessoas, você precisa de uma camada acima do framework. O Omnigent é essa camada e oferece:

  • Composição. Combine múltiplos modelos, frameworks e técnicas sem reescrever código, e alterne entre Claude Code, Codex, Pi e seus próprios agentes com alterações de apenas uma linha.
  • Controle. Políticas contextuais e com estado que rastreiam as ações dos agentes e aplicam regras de proteção, como orçamentos de custo e permissões na camada do meta-framework, e não por meio de prompts.
  • Colaboração. Compartilhe sessões de agentes ao vivo via URL e revise arquivos nelas em conjunto, para que os colegas de equipe possam revisar, comentar e direcionar os agentes juntos em tempo real.

Como o Omnigent funciona

O Omnigent introduz uma interface comum acima dos agentes de linha de comando e SDKs de agentes para permitir que você os combine e intercale facilmente, focando então nos problemas compartilhados onde um framework para. A principal percepção é que, independentemente de como cada framework de agente aciona seu LLM internamente, a interface para os usuários é a mesma: entrada de mensagens e arquivos, saída de fluxos de texto e chamadas de ferramentas. Dessa forma, criamos uma API comum que envolve tanto agentes de codificação baseados em terminal (Claude Code, Codex, Pi, etc.) quanto SDKs (OpenAI Agents, Claude Agents SDK, etc.).

Sobre essa interface, a versão atual do Omnigent adiciona os seguintes recursos principais:

  • Colaboração em tempo real: você pode convidar outras pessoas para visualizar sua sessão de agente, comentar em arquivos em seu espaço de trabalho ou até mesmo enviar comandos, de modo que suas sessões e diretórios de trabalho se tornem o principal local de colaboração.
  • Múltiplas interfaces para o mesmo agente: depois de conectar um agente como o Claude Code ao servidor do Omnigent, você poderá acessá-lo na web, no celular, no aplicativo nativo do Mac OS ou por meio de APIs.
  • Execução em nuvem: inicie qualquer agente em sua própria máquina ou em provedores de sandbox hospedados, como o Modal e o Daytona, para uma colaboração segura em um ambiente isolado.
  • Políticas de segurança contextuais: as políticas de segurança do Omnigent vão além do simples “permitir X / negar Y” dos agentes de codificação, rastreando o estado dinâmico de cada sessão para tomar decisões mais inteligentes. Por exemplo, você pode definir que, após um agente baixar um novo pacote do npm, ele deve exigir aprovação humana para fazer um git push, ou que ele só deve conseguir gravar nos documentos que ele mesmo criou, e não em qualquer documento.
  • Políticas de custo: uma das coisas que rastreamos dinamicamente é o custo de LLM de cada sessão. Por exemplo, você pode solicitar ao Omnigent que pause um agente e peça autorização para continuar a cada US$ 100 gastos.
  • Sandbox de OS robusto: no Omnigent, incluímos um sandbox de OS flexível desenvolvido por nossa equipe de segurança, com a capacidade de bloquear de forma flexível o acesso ao OS, além de interceptar e transformar solicitações de rede (por exemplo, nunca permitir que um agente veja seu token de segurança do GitHub, mas, em vez disso, injetá-lo apenas no proxy de saída em solicitações aprovadas).
  • Criação multi-framework: especifique um agente personalizado como um YAML e porte-o entre frameworks com uma alteração de apenas uma linha, ou combine subagentes usando frameworks diferentes no mesmo agente.

No entanto, esses recursos são apenas a ponta do iceberg do que pode ser feito na camada do meta-framework, e esperamos ver muito mais ideias em breve da nossa equipe e da comunidade de código aberto. Alguns itens em nosso roadmap incluem otimização automática no nível do meta-framework com o GEPA, introspecção baseada em código dentro de agentes semelhante ao MemEx e ao RLM, um MCP do Omnigent Server para que os agentes possam trabalhar em suas sessões, e mais frameworks. Também facilitamos a implantação do Omnigent em uma ampla variedade de infraestruturas, incluindo sandboxes do Fly.io, Railway, Modal e Daytona, além de muitos provedores de LLM, e aceitamos contribuições para mais integrações.

Um meta-framework para combinar, controlar e compartilhar seus agentes

Uma nova camada para trabalhar com agentes

Muitas das maiores mudanças em nosso setor vieram da transição para uma nova camada de abstração: por exemplo, enquanto os engenheiros costumavam gerenciar processos e servidores individuais, agora eles podem gerenciar uma frota inteira por meio de sistemas em nuvem como o Kubernetes e o Terraform.

Acreditamos que os agentes estão no mesmo ponto hoje. Cada framework é seu próprio silo, com seu próprio contexto, seus próprios controles e sua própria maneira de executar, e nada disso é transferido quando você muda de ferramenta. Além disso, muitos problemas abrangem intrinsecamente vários frameworks, incluindo composição, segurança e colaboração. Um meta-framework eleva seu trabalho acima de qualquer framework individual, para que suas sessões, políticas e habilidades permaneçam com você, não importa qual agente ou modelo esteja em execução. Os modelos e frameworks continuarão mudando à medida que a área evolui; a camada em que você trabalha não deveria ter que mudar.

Estamos construindo essa camada abertamente e adoraríamos que você a construísse conosco.

Experimente

O Omnigent já está disponível em código aberto na versão alfa.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.