Da 9 fonti di dati isolate a informazioni di conformità in tempo reale per il retail in pochi minuti.
di Babu Chinnaswamy, Nicholas Dylla, Alissa Ellingson e Harish Gaur
Ecolab utilizza Claude Sonnet e Haiku di Anthropic sulle Databricks Foundation Model API per convertire i manuali FDA sulla sicurezza alimentare di 700 pagine in risposte citate e in tempo reale per il personale di vendita in prima linea.
Sviluppata come Databricks App nativa con Lakebase Postgres e Unity Catalog, la soluzione unifica nove fonti di dati isolate e riduce i tempi di compilazione dei report di conformità da due settimane a meno di due minuti.
Un framework di orchestrazione multi-agente con memoria a doppio strato offre un'intelligenza personalizzata, continuamente perfezionata da cinque LLM Judge e dal tracciamento MLflow.
Quando il direttore di un punto vendita di una grande catena di alimentari ha bisogno di conoscere la corretta temperatura di conservazione a caldo per un pollo allo spiedo, la risposta si trova nascosta da qualche parte in un codice alimentare della FDA di 700 pagine. Fino a poco tempo fa, trovarla significava ore di ricerca manuale o una telefonata che rischiava di non ricevere risposta.
Questo era solo un sintomo di un problema più grande. Ecolab, leader globale nei settori dell'acqua, dell'igiene e della prevenzione delle infezioni, monitora la sicurezza alimentare, il controllo dei parassiti e la qualità dell'acqua per migliaia di punti vendita e fast food in tutto il Nord America. Ma i dati che alimentavano questi servizi risiedevano in nove sistemi separati: audit, ispezioni sanitarie, telemetria IoT per il controllo dei parassiti, checklist, registri sull'uso di sostanze chimiche, feed meteo, recensioni di Yelp, dati di quartiere del CDC e lo stesso codice alimentare della FDA.
"Avevamo nove diverse fonti di dati, nove diverse intelligenze e nessun modo per avere una visione d'insieme di un singolo punto vendita" — Nicholas Dylla, Technical Lead presso Ecolab
Ecolab ha deciso di cambiare le cose e ha creato qualcosa di molto più ambizioso di una dashboard unificata.
L'applicazione Retail Intelligence di Ecolab è una Databricks App nativa con Lakebase Postgres come spina dorsale transazionale. Tutte e nove le fonti di dati fluiscono attraverso Lakeflow e Spark Declarative Pipelines in un lakehouse governato sotto Unity Catalog, distribuito in modo riproducibile tramite Databricks Asset Bundles.
Poiché l'app viene eseguita all'interno del perimetro di sicurezza di Databricks, Ecolab ottiene autenticazione integrata, service principal automatici e controlli di acesso di Unity Catalog senza dover configurare un'infrastruttura separata. Tutto ciò che l'utente finale vede proviene da Databricks.

Figura 1: Architettura dell'app Retail Intelligence
Ma unificare i dati era solo metà dell'opera. La vera domanda era: come si fa a far sembrare nove fonti di intelligence un unico esperto conversazionale?
Databricks offre a Ecolab un'unica piattaforma per dati, AI e governance senza la necessità di configurare o gestire un'infrastruttura ML separata. Attraverso le Foundation Model APIs, Ecolab distribuisce Claude Sonnet per il ragionamento complesso, Haiku per una sintesi rapida ed economica e Gemini per l'analisi delle immagini, il tutto dallo stesso piano di controllo. Se domani dovesse emergere un modello migliore, lo sostituiranno senza dover riprogettare l'architettura. Ogni chiamata al modello rimane all'interno del perimetro di sicurezza di Databricks. Il gateway Unity AI Gateway aggiunge funzionalità di logging del payload, limitazione della frequenza per utente (rate limiting), guardrail per i dati PII e fallback automatici, mentre Unity Catalog governa l'accesso sia ai dati sia ai modelli che li distribuiscono.
Distribuzione di Claude su Databricks
Al centro di questo framework c'è Claude di Anthropic, distribuito tramite le stesse Foundation Model APIs.
Claude Sonnet funge da motore di ragionamento principale, sintetizzando normative complesse e mantenendo la memoria a lungo termine dell'utente. Claude Haiku gestisce la sintesi, condensando la cronologia delle conversazioni ogni tre turni e riassumendo segnali di dati prolissi in brevi report concisi, mantenendo le interazioni rapide ed economiche.
Ecolab ha scelto Claude dopo aver valutato diversi provider. Il formato di risposta del modello si è rivelato il più adatto per la sintesi della conformità e il loro tenant Claude ospitato privatamente ha soddisfatto rigidi requisiti di sicurezza. Allo stesso tempo, la piattaforma Databricks offre loro una flessibilità multi-modello.
Sotto il cofano, il sistema segue un pattern Multi-Agent-Supervisor orchestrato tramite Databricks Workflows.
Quando il direttore di un punto vendita digita una domanda, l'Agente Coordinatore la scompone in sotto-attività e delega ciascuna a un sotto-agente specializzato. Un sotto-agente potrebbe recuperare il passaggio pertinente della FDA tramite Vector Search. Un altro interroga i dati strutturati di conformità tramite SQL e le funzioni di Unity Catalog. Un terzo estrae la telemetria sui parassiti da un server MCP esterno. L'Agente di Risposta assembla quindi tutto in un'unica risposta con citazioni e salva l'interazione in Lakebase.

Figura 2: Orchestrazione da agente ad agente
Ciò che rende l'esperienza personalizzata è l'architettura di memoria a doppio livello.
A breve termine (memoria di lavoro). Ogni query porta gli ultimi dieci turni di conversazione direttamente nel prompt, il classico approccio conversation buffer. Per mantenere il contesto compatto man mano che la sessione cresce, Claude Haiku 4.5 esegue un sintetizzatore inline ogni tre turni, riducendo gli scambi precedenti in un riassunto denso. Il caching dei prompt mantiene efficiente il contesto attivo sulla rete, e lo strumento di memoria fornisce un passaggio strutturato tra lo stato attivo e lo stato persistente.
A lungo termine (memoria semantica). Tra una sessione e l'altra, Claude Sonnet 4.6 mantiene un profilo per utente (ruolo, preferenze, aree di interesse ricorrenti, contesto della posizione e pattern comportamentali). I profili sono memorizzati come record strutturati e aggiornati continuamente man mano che l'utente interagisce. Questo rispecchia il pattern di memoria a lungo termine.
L'effetto combinato: il direttore di un punto vendita che ritorna dopo settimane di assenza apre l'assistente e ottiene risposte che tengono già conto del suo territorio, dei suoi ticket aperti e del suo flusso di lavoro, senza dover inserire nuovamente prompt, presentarsi di nuovo o rispiegare chi sia.

Figura 3: Architettura delle query e flusso del payload di memoria
La qualità non è mai statica. Cinque LLM Judge valutano ogni interazione su molteplici dimensioni. Il feedback degli utenti si combina con segnali impliciti per alimentare un ciclo automatizzato di ottimizzazione dei prompt. MLflow traccia ogni percorso di esecuzione, mentre le dashboard monitorano la latenza e i tassi di errore in tempo reale. Il team analizza persino i log delle query per creare domande predefinite migliori in base a ciò che i direttori chiedono effettivamente.
Le risposte degli agenti in tempo reale sono solo metà dell'opera. Per carichi di lavoro offline ad alto volume — come la valutazione retroattiva delle ispezioni storiche, la generazione di report di conformità per l'intero portfolio e l'alimentazione del ciclo di valutazione degli LLM Judge — Ecolab utilizza funzioni di inferenza batch di Databricks AI come ai_query() per applicare Claude su migliaia di record in una singola chiamata SQL. Quella che un tempo era un'elaborazione sequenziale riga per riga ora viene completata in parallelo in pochi secondi, regolata dalle stesse policy di Unity Catalog che proteggono l'agente live.
L'impatto è stato immediato. Ciò che un tempo richiedeva due settimane per estrarre manualmente i dati da nove sistemi isolati al fine di compilare un singolo report di conformità per il punto vendita di un cliente, ora viene completato in meno di due minuti. Una domanda sul codice alimentare della FDA che costringeva i direttori a spulciare un PDF di 700 pagine per ore, ora restituisce in pochi secondi una risposta con citazioni in un linguaggio semplice.
Dietro le quinte, nove fonti di dati separate sono state unificate in un unico lakehouse governato, che serve centinaia di sedi in Nord America al momento del lancio a metà aprile 2026. E poiché l'agente conversazionale supporta circa dodici lingue con un'accuratezza del ~98%, il personale in prima linea può interagire nella lingua con cui si sente più a proprio agio.
La velocità è solo il punto di partenza. Il vero valore nel comprimere due settimane in due minuti risiede in ciò che i team fanno con il tempo risparmiato e, cosa ancora più importante, nei problemi che riescono a individuare prima che si trasformino in sanzioni.
Un problema di infestazione che costituisce anche una violazione della sicurezza alimentare viene segnalato, analizzato e risolto una sola volta, anziché essere rilevato due volte in flussi di lavoro separati. Per i clienti di Ecolab, il risultato si traduce in livelli di conformità nettamente migliori, meno sanzioni e un partner in grado di fornire informazioni in modo proattivo anziché reattivo. Per Ecolab, si tratta di una piattaforma che rafforza le relazioni con i clienti e trasforma i dati operativi in un vantaggio competitivo duraturo.
"Ciò che prima richiedeva due settimane, estraendo dati da nove sistemi diversi per compilare un unico report di conformità, ora richiede meno di due minuti grazie a Claude su Databricks. Il nostro personale in prima linea in 600 sedi riceve in pochi secondi risposte precise e documentate, in un linguaggio semplice, tratte da un codice alimentare della FDA di 700 pagine, nella lingua con cui si sente più a proprio agio." — Josh McCoy, Product Manager for Retail Intelligence, Ecolab
In futuro, Ecolab prevede di aggiungere azioni automatizzate basate su MCP — ispezioni dei parassiti,
riordini di prodotti chimici, norme sulla sicurezza alimentare e ordini di lavoro avviati direttamente dall'interfaccia di chat — trasformando il sistema da un livello di intelligence a un vero e proprio agente operativo.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.