Direkt zum Hauptinhalt
AI Engineering

Wir stellen Omnigent vor: Ein Meta-Harness zum Kombinieren, Steuern und Teilen Ihrer Agents

von Matei Zaharia und Kasey Uhlenhuth

  • Agenten-Harnesses machten Modelle austauschbar. Wir glauben, dass die nächste Abstraktionsebene das Meta-Harness ist – die Ebene über jedem Harness, auf der Komposition, Steuerung und Zusammenarbeit stattfinden.
  • Omnigent ist unser Open-Source-Meta-Harness: eine einheitliche Schnittstelle für Claude Code, Codex, Pi und Ihre eigenen benutzerdefinierten Agenten, wobei jede Sitzung über das Terminal, das Web, den Desktop und Ihr Telefon erreichbar ist.
  • Erstellen Sie Agenten-Teams, die verschiedene Harnesses und Modelle kombinieren, steuern Sie diese mit Richtlinien statt Prompts und teilen Sie Live-Sitzungen mit Teammitgliedern, anstatt Inhalte zwischen Tools hin- und herzukopieren.

Bei Databricks nutzen und entwickeln wir intensiv Agenten – vom Coding mit ihnen im großen Stil bis hin zur Bereitstellung von Agenten-Produkten wie Genie. Doch obwohl die Fähigkeiten von Agenten viel besser geworden sind, fühlt sich die Arbeit mit ihnen sperrig an. Als User haben wir oft 4–5 Agenten gleichzeitig geöffnet (Coding-Agenten, Gemini-Suche usw.) und verbringen unsere Zeit damit, Text zwischen ihnen und Docs, Slack und anderen Kollaborationstools hin- und herzukopieren. Und als Entwickler von Agenten befinden wir uns in einem Hamsterrad, um unsere Agenten durch die Kombination der neuesten Harnesses, SDKs und Modelle zu verbessern. Das Problem ist, dass LLM-Fähigkeiten in einen Agenten-Harness verpackt sind, und diese Harnesses haben unterschiedliche Schnittstellen, was das Kombinieren oder Austauschen erschwert.

Deshalb haben wir Omnigent entwickelt: einen Meta-Harness, der über den von Ihnen bereits genutzten Agenten (Claude Code, Codex, Pi oder benutzerdefinierten Agenten) liegt und sie zu interoperablen Teilen eines umfassenderen Systems macht. Omnigent setzt an den Problemen an, bei denen ein einzelner Harness an seine Grenzen stößt: Es bietet einfache Möglichkeiten, mehrere Agenten zu kombinieren, sie mit erweiterten Richtlinien (Policies) zu steuern und live mit Teammitgliedern zusammenzuarbeiten.

Wir glauben, dass Menschen bald über diese neue Ebene, den Meta-Harness, mit Agenten arbeiten werden. Deshalb stellen wir Omnigent heute unter Apache 2.0 als Open Source zur Verfügung.

Omnigent-Architektur: Ein Runner kapselt jeden Agenten in einer Sandbox-Session mit einer einheitlichen API. Ein Server stellt Richtlinien und Freigaben bereit und macht jede Session über das Terminal, die App und Web-APIs zugänglich.

Warum einen Meta-Harness entwickeln?

Bei Databricks haben wir Coding-Agenten frühzeitig in unserem über 5.000 Mitglieder starken Engineering-Team eingeführt und Tausende von Agenten für Kunden entwickelt. Diese Erfahrung hat uns davon überzeugt, dass sich die Grenzen des Agenten-Engineerings auf eine neue Ebene verlagern. Die besten Ergebnisse kommen nicht mehr von einem einzelnen Modell in einem einzelnen Harness: Harvey hat ein führendes Modell in Bezug auf Qualität und Kosten geschlagen, indem es einem Open-Source-Worker-Modell einen führenden Advisor an die Seite stellte, den es aufrufen kann. Anthropic hat sein Forschungsprodukt als Lead-Agenten aufgebaut, der parallele Subagenten orchestriert, und unser eigenes Genie nutzt verschiedene LLMs für Planung, Suche und Code-Generierung. Auch Ingenieure verändern ihre Arbeitsweise: Anstatt einen Agenten nach dem anderen zu prompten, entwerfen sie Schleifen, die ganze Teams von Agenten steuern.

Diese Muster erstrecken sich über mehrere Harnesses, Modelle und Personen, aber jeder Harness versteht nur seine eigenen Sessions. Um Agenten zu kombinieren, zu verwalten und mit anderen Personen an ihnen zu arbeiten, benötigen Sie eine Ebene über dem Harness. Omnigent ist diese Ebene und bietet:

  • Komposition. Kombinieren Sie mehrere Modelle, Harnesses und Techniken, ohne Code neu schreiben zu müssen, und wechseln Sie mit einzeiligen Änderungen zwischen Claude Code, Codex, Pi und Ihren eigenen Agenten.
  • Steuerung. Zustandsabhängige, kontextbezogene Richtlinien (Policies), die Agentenaktionen verfolgen und Leitplanken (Guardrails) wie Kostenbudgets und Berechtigungen auf der Meta-Harness-Ebene durchsetzen, nicht über Prompts.
  • Kollaboration. Teilen Sie Live-Agenten-Sessions per URL und prüfen Sie gemeinsam Dateien darin, sodass Teammitglieder Agenten in Echtzeit gemeinsam überprüfen, kommentieren und steuern können.

Wie Omnigent funktioniert

Omnigent führt eine gemeinsame Schnittstelle über Befehlszeilen-Agenten und Agenten-SDKs ein, damit Sie diese einfach kombinieren und austauschen können, und konzentriert sich dann auf die gemeinsamen Probleme, bei denen ein Harness aufhört. Die wichtigste Erkenntnis ist: Unabhängig davon, wie jeder Agenten-Harness intern sein LLM aufruft, ist die Schnittstelle zu den Usern dieselbe: Nachrichten und Dateien rein, Text-Streams und Tool-Aufrufe raus. Deshalb haben wir eine gemeinsame API entwickelt, die sowohl terminalbasierte Coding-Agenten (Claude Code, Codex, Pi usw.) als auch SDKs (OpenAI Agents, Claude Agents SDK usw.) kapselt.

Auf dieser Schnittstelle aufbauend bietet die aktuelle Version von Omnigent die folgenden Hauptfunktionen:

  • Echtzeit-Kollaboration: Sie können andere Personen einladen, Ihre Agenten-Session anzusehen, Dateien in deren Workspace zu kommentieren oder sogar Befehle zu senden, sodass Ihre Sessions und Arbeitsverzeichnisse zum zentralen Ort Ihrer Zusammenarbeit werden.
  • Mehrere Schnittstellen zum selben Agenten: Sobald Sie einen Agenten wie Claude Code mit dem Omnigent-Server verbinden, können Sie über das Web, Mobilgeräte, die native Mac OS-App oder APIs darauf zugreifen.
  • Cloud-Ausführung: Starten Sie jeden Agenten auf Ihrem eigenen Rechner oder bei gehosteten Sandbox-Anbietern wie Modal und Daytona, um sicher in einer abgeschirmten Umgebung zusammenzuarbeiten.
  • Kontextbezogene Sicherheitsrichtlinien: Die Sicherheitsrichtlinien von Omnigent gehen über das einfache „X erlauben / Y verbieten“ von Coding-Agenten hinaus. Sie verfolgen den dynamischen Zustand jeder Session, um intelligentere Entscheidungen zu treffen. Sie können beispielsweise festlegen, dass ein Agent nach dem Herunterladen eines neuen Pakets von npm eine menschliche Genehmigung für einen „git push“ benötigt oder dass er nur in von ihm erstellte Dokumente schreiben darf, nicht in beliebige Dokumente.
  • Kostenrichtlinien: Eines der Dinge, die wir dynamisch verfolgen, sind die LLM-Kosten jeder Session. Sie können Omnigent beispielsweise anweisen, einen Agenten zu pausieren und nach jeweils 100 ausgegebenen US-Dollar zu fragen, ob er fortfahren soll.
  • Starke OS-Sandbox: In Omnigent integrieren wir eine flexible OS-Sandbox unseres Sicherheitsteams, mit der sich der OS-Zugriff flexibel einschränken lässt und Netzwerk-anfragen abzufangen und zu transformieren (lassen Sie beispielsweise einen Agenten niemals Ihr GitHub-Sicherheits-Token sehen, sondern schleusen Sie es stattdessen nur im Egress-Proxy bei genehmigten Anfragen ein).
  • Multi-Harness-Erstellung: Definieren Sie einen benutzerdefinierten Agenten als YAML und portieren Sie ihn mit einer einzeiligen Änderung über verschiedene Harnesses hinweg, oder kombinieren Sie Subagenten, die unterschiedliche Harnesses nutzen, im selben Agenten.

Diese Funktionen kratzen jedoch nur an der Oberfläche dessen, was auf der Meta-Harness-Ebene möglich ist, und wir erwarten schon bald viele weitere Ideen von unserem Team und der Open-Source-Community. Einige Punkte auf unserer Roadmap sind die automatische Optimierung auf Meta-Harness-Ebene mit GEPA, codebasierte Introspektion innerhalb von Agenten ähnlich wie bei MemEx und RLM, ein Omnigent Server MCP, damit Agenten sessionübergreifend arbeiten können, sowie weitere Harnesses. Wir haben es außerdem einfach gemacht, Omnigent auf einer Vielzahl von Infrastrukturen bereitzustellen, darunter Fly.io, Railway, Modal- und Daytona-Sandboxes sowie viele LLM-Anbieter, und wir freuen uns über Patches für weitere Integrationen.

Ein Meta-Harness zum Kombinieren, Steuern und Teilen Ihrer Agenten

Eine neue Ebene für die Arbeit mit Agenten

Viele der größten Veränderungen in unserer Branche resultierten aus dem Wechsel zu einer neuen Abstraktionsebene: Während Ingenieure früher beispielsweise einzelne Prozesse und Server verwalten mussten, können sie heute eine ganze Flotte über Cloud-Systeme wie Kubernetes und Terraform steuern.

Wir glauben, dass Agenten heute an einem ähnlichen Punkt stehen. Jeder Harness ist sein eigenes Silo mit eigenem Kontext, eigenen Steuerungen und eigener Ausführungsweise – und nichts davon wird übernommen, wenn Sie das Tool wechseln. Darüber hinaus erstrecken sich viele Probleme von Natur aus über mehrere Harnesses hinweg, darunter Komposition, Sicherheit und Kollaboration. Ein Meta-Harness hebt Ihre Arbeit über jeden einzelnen Harness hinaus, sodass Ihre Sessions, Richtlinien und Skills erhalten bleiben, unabhängig davon, welcher Agent oder welches Modell gerade läuft. Die Modelle und Harnesses werden sich im Zuge der Weiterentwicklung des Fachbereichs ständig verändern – die Ebene, auf der Sie arbeiten, sollte das nicht tun müssen.

Wir entwickeln diese Ebene offen und würden uns freuen, wenn Sie sie gemeinsam mit uns aufbauen.

Probieren Sie es aus

Omnigent ist ab heute als Open Source in der Alpha-Version verfügbar.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.