Aus 9 isolierten Datenquellen in wenigen Minuten zu Echtzeit-Compliance-Intelligence für den Einzelhandel.
von Babu Chinnaswamy, Nicholas Dylla, Alissa Ellingson und Harish Gaur
Ecolab nutzt Claude Sonnet und Haiku von Anthropic auf den Databricks Foundation Model APIs, um 700-seitige FDA-Handbücher zur Lebensmittelsicherheit in zitierte Echtzeit-Antworten für das Verkaufspersonal vor Ort zu verwandeln.
Die Lösung wurde als native Databricks App mit Lakebase Postgres und Unity Catalog entwickelt. Sie führt neun isolierte Datenquellen zusammen und verkürzt die Erstellung von Compliance-Berichten von zwei Wochen auf unter zwei Minuten.
Ein Multi-Agenten-Orchestrierungs-Framework mit zweischichtigem Speicher liefert personalisierte Intelligenz, die durch fünf Judge LLMs und MLflow-Tracing kontinuierlich optimiert wird.
Wenn ein Filialleiter eines großen Lebensmitteleinzelhändlers die richtige Warmhaltetemperatur für ein Brathähnchen wissen muss, ist die Antwort irgendwo in einem 700-seitigen FDA-Lebensmittelkodex vergraben. Bis vor Kurzem bedeutete die Suche danach stundenlange manuelle Recherche oder einen Telefonanruf, der vielleicht nicht erwidert wurde.
Das war nur ein Symptom eines größeren Problems. Ecolab, ein weltweit führender Anbieter von Lösungen in den Bereichen Wasser, Hygiene und Infektionsprävention, überwacht die Lebensmittelsicherheit, Schädlingsbekämpfung und Wasserqualität für Tausende von Einzelhandels- und Fast-Food-Standorten in ganz Nordamerika. Doch die Daten, die diese Dienste speisten, lagen in neun verschiedenen Systemen – Audits, Gesundheitsinspektionen, IoT-Telemetrie zur Schädlingsbekämpfung, Checklisten, Protokolle zur Chemikaliennutzung, Wetter-Feeds, Yelp-Bewertungen, CDC-Nachbarschaftsdaten und der FDA-Lebensmittelkodex selbst.
„Wir hatten neun verschiedene Datenquellen, neun verschiedene Informationssysteme und keine Möglichkeit, das Gesamtbild für einen einzelnen Standort zu sehen“ – Nicholas Dylla, Technical Lead bei Ecolab
Ecolab machte sich daran, das zu ändern, und entwickelte etwas, das weitaus ehrgeiziger war als ein einheitliches Dashboard.
Die Retail Intelligence-Anwendung von Ecolab ist eine native Databricks App mit Lakebase Postgres als transaktionalem Rückgrat. Alle neun Datenquellen fließen über Lakeflow und Spark Declarative Pipelines in ein kontrolliertes Lakehouse unter Unity Catalog, das reproduzierbar über Databricks Asset Bundles bereitgestellt wird.
Da die App innerhalb des Sicherheitsbereichs von Databricks ausgeführt wird, erhält Ecolab integrierte Authentifizierung, automatische Service-Principals und Unity Catalog-Zugriffskontrollen, ohne eine separate Infrastruktur aufbauen zu müssen. Alles, was der Endbenutzer sieht, stammt aus Databricks.

Abbildung 1: Architektur der Retail Intelligence-App
Doch die Daten zusammenzuführen, war nur die halbe Miete. Die eigentliche Frage war: Wie sorgt man dafür, dass sich neun verschiedene Informationsquellen wie ein einziger, dialogorientierter Experte anfühlen?
Databricks bietet Ecolab eine einzige Plattform für Daten, KI und Governance, ohne dass eine separate ML-Infrastruktur aufgebaut oder verwaltet werden muss. Über Foundation Model APIs stellt Ecolab Claude Sonnet für komplexe logische Schlussfolgerungen, Haiku für eine schnelle und kostengünstige Zusammenfassung und Gemini für die Bildanalyse bereit – und das alles über dieselbe Control Plane. Wenn morgen ein besseres Modell auf den Markt kommt, tauschen sie es einfach aus, ohne die Architektur anpassen zu müssen. Jeder Modellaufruf bleibt innerhalb des Sicherheitsbereichs von Databricks. Das Unity AI Gateway bietet zusätzliche Funktionen wie Payload-Protokollierung, Ratenbegrenzung pro Benutzer, PII-Schutzmaßnahmen und automatische Fallbacks, während Unity Catalog den Zugriff auf die Daten und die bereitgestellten Modelle regelt.
Bereitstellung von Claude auf Databricks
Das Herzstück dieses Frameworks ist Claude von Anthropic, das über dieselben Foundation Model APIs bereitgestellt wird.
Claude Sonnet fungiert als primäre Reasoning-Engine, die komplexe Vorschriften aufbereitet und ein langfristiges Benutzergedächtnis aufrechterhält. Claude Haiku übernimmt die Zusammenfassung, indem es den Gesprächsverlauf alle drei Gesprächsschritte komprimiert und ausführliche Datensignale in prägnante Berichte umwandelt, während die Interaktionen schnell und kostengünstig bleiben.
Ecolab hat sich nach der Evaluierung mehrerer Anbieter für Claude entschieden. Das Antwortformat des Modells erwies sich als am besten geeignet für die Zusammenfassung von Compliance-Richtlinien, und ihr privat gehosteter Claude-Tenant erfüllte die strengen Sicherheitsanforderungen. Gleichzeitig bietet die Databricks-Plattform ihnen Multi-Modell-Flexibilität.
Unter der Haube folgt das System einem Multi-Agent-Supervisor-Muster, das über Databricks Workflows orchestriert wird.
Wenn ein Filialleiter eine Frage eingibt, zerlegt der Coordinator-Agent diese in Teilaufgaben und delegiert sie an spezialisierte Sub-Agenten. Ein Sub-Agent ruft beispielsweise den relevanten FDA-Abschnitt über Vector Search ab. Ein anderer fragt strukturierte Compliance-Daten über SQL und Unity Catalog-Funktionen ab. Ein dritter ruft Schädlings-Telemetriedaten von einem externen MCP-Server ab. Der Response-Agent fügt dann alles zu einer einzigen, mit Quellen versehenen Antwort zusammen und speichert die Interaktion dauerhaft in Lakebase.

Abbildung 2: Agent-zu-Agent-Orchestrierung
Was das Erlebnis so persönlich macht, ist die zweistufige Speicherarchitektur.
Kurzzeitgedächtnis (Arbeitsspeicher). Jede Anfrage enthält die letzten zehn Gesprächsschritte direkt im Prompt – der klassische Conversation-Buffer-Ansatz. Um diesen Kontext bei längeren Sitzungen kompakt zu halten, führt Claude Haiku 4.5 alle drei Gesprächsschritte eine Inline-Zusammenfassung aus, die frühere Interaktionen in eine dichte Zusammenfassung komprimiert. Prompt-Caching sorgt dafür, dass der aktive Kontext bei der Übertragung effizient bleibt, und das Memory-Tool bietet eine strukturierte Übergabe zwischen aktivem und dauerhaftem Zustand.
Langzeitgedächtnis (semantischer Speicher). Über Sitzungen hinweg erstellt Claude Sonnet 4.6 ein Profil pro Benutzer (Rolle, Präferenzen, wiederkehrende Schwerpunkte, Standortkontext und Verhaltensmuster). Profile werden als strukturierte Datensätze gespeichert und bei jeder Interaktion des Benutzers kontinuierlich aktualisiert. Dies spiegelt das langfristige Memory-Pattern wider.
Der kombinierte Effekt: Ein Filialleiter, der nach wochenlanger Abwesenheit zurückkehrt, öffnet den Assistenten und erhält Antworten, die bereits seinen Bereich, seine offenen Tickets und seinen Workflow berücksichtigen – ohne dass neue Prompts, eine erneute Vorstellung oder Erklärungen darüber, wer er ist, erforderlich sind.

Abbildung 3: Abfragearchitektur und Speicher-Payload-Fluss
Qualität ist niemals statisch. Fünf Judge-LLMs bewerten jede Interaktion in mehreren Dimensionen. Benutzerfeedback wird mit impliziten Signalen kombiniert, um eine automatisierte Prompt-Optimierungsschleife zu speisen. MLflow verfolgt jeden Ausführungspfad, während Dashboards Latenzzeiten und Fehlerraten in Echtzeit überwachen. Das Team analysiert sogar Abfrageprotokolle, um bessere Standardfragen zu erstellen, die darauf basieren, was Filialleiter tatsächlich fragen.
Echtzeit-Antworten von Agenten sind nur die halbe Miete. Für hochvolumige Offline-Workloads – wie die nachträgliche Bewertung historischer Inspektionen, die Erstellung portfolioübergreifender Compliance-Berichte und die Unterstützung der Judge-LLM-Evaluierungsschleife – nutzt Ecolab Databricks-KI-Batch-Inferenzfunktionen wie ai_query(), um Claude über einen einzigen SQL-Aufruf auf Tausende von Datensätzen anzuwenden. Was früher eine sequenzielle Verarbeitung Zeile für Zeile war, wird nun in Sekundenschnelle parallel ausgeführt – geregelt durch dieselben Unity Catalog-Richtlinien, die auch den Live-Agenten schützen.
Die Wirkung war sofort spürbar. Was früher zwei Wochen dauerte, um manuell Daten aus neun isolierten Systemen zusammenzutragen und einen einzigen Compliance-Bericht für einen Kundenstandort zu erstellen, ist heute in weniger als zwei Minuten erledigt. Eine Frage zum FDA-Lebensmittelkodex, bei der Filialleiter stundenlang ein 700-seitiges PDF durchsuchen mussten, liefert nun in Sekundenschnelle eine präzise Antwort mit Quellenangabe in verständlicher Sprache.
Hinter den Kulissen wurden neun separate Datenquellen in einem einzigen kontrollierten Lakehouse zusammengeführt, das zum Start Mitte April 2026 Hunderte von nordamerikanischen Standorten bedient. Und da der dialogorientierte Agent rund zwölf Sprachen mit einer Genauigkeit von ca. 98 % unterstützt, können die Mitarbeiter vor Ort in der Sprache kommunizieren, mit der sie sich am wohlsten fühlen.
Geschwindigkeit ist nur der Anfang. Der wahre Wert der Komprimierung von zwei Wochen auf zwei Minuten liegt darin, was die Teams mit der gewonnenen Zeit anfangen und, was noch wichtiger ist, welche Probleme sie erkennen, bevor diese zu Strafen führen.
Ein Schädlingsproblem, das gleichzeitig einen Verstoß gegen die Lebensmittelsicherheit darstellt, wird einmal markiert, untersucht und gelöst, anstatt zweimal in separaten Workflows entdeckt zu werden. Für die Kunden von Ecolab bedeutet dies eine messbar bessere Compliance-Aufstellung, weniger Strafzahlungen und einen Partner, der Erkenntnisse proaktiv statt reaktiv liefert. Für Ecolab ist es eine Plattform, die Kundenbeziehungen vertieft und operative Daten in einen dauerhaften Wettbewerbsvorteil verwandelt.
"Was früher zwei Wochen dauerte – das Zusammentragen von Daten aus neun Systemen zur Erstellung eines einzigen Compliance-Berichts –, dauert mit Claude auf Databricks jetzt weniger als zwei Minuten. Unsere Mitarbeiter an vorderster Front an 600 Standorten erhalten in Sekundenschnelle präzise, leicht verständliche Antworten aus einem 700-seitigen FDA-Lebensmittelkodex, und zwar in der Sprache, die ihnen am vertrautesten ist." — Josh McCoy, Product Manager für Retail Intelligence, Ecolab
Als Nächstes plant Ecolab die Einführung von MCP-gesteuerten automatisierten Aktionen – Schädlingsbekämpfung,
Nachbestellungen von Chemikalien, Lebensmittelsicherheitsstandards und Arbeitsaufträge, die direkt über die Chat-Schnittstelle ausgelöst werden –, wodurch das System von einer reinen Informationsebene zu einem vollwertigen operativen Agenten wird.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.