Vente au détail et biens de consommation

11 juin 2026

Comment Ecolab a reconstruit l'intelligence du commerce de détail sur Databricks et Anthropic Claude

9 sources de données cloisonnées transformées en intelligence de conformité en temps réel pour la vente au détail, en quelques minutes.

par Babu Chinnaswamy, Nicholas Dylla, Alissa Ellingson et Harish Gaur

Ecolab utilise Claude Sonnet et Haiku d'Anthropic sur les API Databricks Foundation Model pour convertir des manuels de sécurité alimentaire de la FDA de 700 pages en réponses citées et en temps réel pour le personnel de vente de première ligne.
Conçue comme une Databricks App native avec Lakebase Postgres et Unity Catalog, la solution unifie neuf sources de données cloisonnées et réduit le temps de compilation des rapports de conformité de deux semaines à moins de deux minutes.
Un framework d'orchestration multi-agent avec une mémoire double couche fournit une intelligence personnalisée, continuellement perfectionnée par cinq LLM juges et le traçage MLflow.

Lorsqu'un responsable de magasin chez un grand distributeur alimentaire a besoin de connaître la température de maintien au chaud correcte pour un poulet rôti, la réponse est enfouie quelque part dans un code alimentaire de la FDA de 700 pages. Jusqu'à récemment, la trouver signifiait des heures de recherche manuelle ou un appel téléphonique qui risquait de rester sans réponse.

Ce n'était là qu'un symptôme d'un problème plus vaste. Ecolab, un leader mondial de l'eau, de l'hygiène et de la prévention des infections, surveille la sécurité alimentaire, la lutte contre les nuisibles et la qualité de l'eau pour des milliers de commerces de détail et de restauration rapide en Amérique du Nord. Mais les données qui alimentaient ces services résidaient dans neuf systèmes distincts : audits, inspections sanitaires, télémétrie IoT pour les nuisibles, listes de contrôle, registres d'utilisation des produits chimiques, flux météo, avis Yelp, données de quartier du CDC et le code alimentaire de la FDA lui-même.

« Nous avions neuf sources de données différentes, neuf intelligences distinctes, et aucun moyen d'avoir une vue d'ensemble pour un seul site » —Nicholas Dylla, responsable technique chez Ecolab

Ecolab a décidé de changer cela et a développé quelque chose de bien plus ambitieux qu'un simple tableau de bord unifié.

De neuf silos à un moteur d'intelligence unique

L'application Retail Intelligence d'Ecolab est une Databricks App native avec Lakebase Postgres comme pilier transactionnel. Les neuf sources de données transitent via Lakeflow et Spark Declarative Pipelines vers un lakehouse gouverné sous Unity Catalog, déployé de manière reproductible via les Databricks Asset Bundles.

Comme l'application s'exécute au sein du périmètre de sécurité de Databricks, Ecolab bénéficie d'une authentification intégrée, de principaux de service automatiques et de contrôles d'accès Unity Catalog sans avoir à déployer d'infrastructure distincte. Tout ce que voit l'utilisateur final provient de Databricks.

Figure 1 : Architecture de l'application Retail Intelligence

Mais unifier les données n'était que la moitié du défi. La vraie question était : comment faire en sorte que neuf sources d'intelligence donnent l'impression d'être un seul et unique expert conversationnel ?

Databricks offre à Ecolab une plateforme unique pour les données, l'IA et la gouvernance, sans qu'il soit nécessaire de déployer ou de gérer une infrastructure ML distincte. Grâce aux Foundation Model APIs, Ecolab déploie Claude Sonnet pour le raisonnement complexe, Haiku pour une synthèse rapide et économique, et Gemini pour l'analyse d'images, le tout à partir du même plan de contrôle. Si un meilleur modèle apparaît demain, ils le remplacent sans modifier l'architecture. Chaque appel de modèle reste dans le périmètre de sécurité de Databricks. L'Unity AI Gateway ajoute des couches de journalisation des charges utiles, de limitation du débit par utilisateur, de garde-fous pour les PII et de basculements automatiques, tandis que Unity Catalog régit l'accès aux données et aux modèles qui les exploitent.

Déploiement de Claude sur Databricks

Au cœur de ce framework se trouve Claude d'Anthropic, servi via ces mêmes Foundation Model APIs.

Claude Sonnet fait office de moteur de raisonnement principal, synthétisant des réglementations complexes et conservant la mémoire à long terme de l'utilisateur. Claude Haiku gère la synthèse, condensant l'historique des conversations tous les trois échanges et transformant des signaux de données verbeux en briefs concis, tout en garantissant des interactions rapides et économiques.

Ecolab a choisi Claude après avoir évalué plusieurs fournisseurs. Le format de réponse du modèle s'est avéré le mieux adapté à la synthèse de conformité, et leur instance Claude hébergée en privé répondait à des exigences de sécurité strictes. Parallèlement, la plateforme Databricks leur offre une flexibilité multi-modèle.

Comment les agents collaborent

Sous le capot, le système suit un modèle Multi-Agent-Supervisor orchestré via Databricks Workflows.

Lorsqu'un responsable de magasin saisit une question, l'agent coordinateur (Coordinator Agent) la divise en sous-tâches et délègue chacune d'elles à un sous-agent spécialisé. Un sous-agent peut récupérer le passage pertinent de la FDA via Vector Search. Un autre interroge des données de conformité structurées via SQL et les fonctions Unity Catalog. Un troisième extrait la télémétrie des nuisibles depuis un serveur MCP externe. L'agent de réponse (Response Agent) assemble ensuite le tout en une seule réponse citée et enregistre l'interaction dans Lakebase.

Figure 2 : Orchestration d'agent à agent

Ce qui rend l'expérience si personnelle, c'est l'architecture de mémoire à double couche.

À court terme (mémoire de travail). Chaque requête intègre directement les dix derniers échanges de la conversation dans le prompt, l'approche classique du conversation buffer. Pour maintenir un contexte précis à mesure que la session progresse, Claude Haiku 4.5 exécute un outil de synthèse intégré tous les trois échanges, condensant les conversations précédentes en un résumé dense. Le Prompt caching permet de gérer efficacement le contexte actif sur le réseau, et l'outil de mémoire assure un transfert structuré entre l'état actif et l'état persistant.

À long terme (mémoire sémantique). D'une session à l'autre, Claude Sonnet 4.6 conserve un profil par utilisateur (rôle, préférences, domaines d'intérêt récurrents, contexte géographique et habitudes comportementales). Les profils sont stockés sous forme d'enregistrements structurés et mis à jour en continu au fil des interactions de l'utilisateur. Cela reproduit le modèle de mémoire à long terme.

L'effet combiné : un responsable de magasin qui revient après des semaines d'absence ouvre l'assistant et obtient des réponses qui prennent déjà en compte son secteur, ses tickets ouverts et son flux de travail, sans avoir à reformuler sa demande, à se réintroduire ou à réexpliquer qui il est.

Figure 3 : Architecture des requêtes et flux de charge utile de la mémoire

La qualité n'est jamais figée. Cinq LLM juges évaluent chaque interaction selon plusieurs dimensions. Les retours des utilisateurs se combinent à des signaux implicites pour alimenter une boucle d'optimisation automatisée des prompts. MLflow trace chaque chemin d'exécution, tandis que des tableaux de bord suivent la latence et les taux d'erreur en temps réel. L'équipe analyse même les journaux de requêtes pour concevoir de meilleures questions par défaut basées sur ce que les responsables demandent réellement.

Les réponses de l'agent en temps réel ne représentent que la moitié de l'histoire. Pour les charges de travail hors ligne à volume élevé — comme l'évaluation rétroactive des inspections historiques, la génération de synthèses de conformité pour l'ensemble du portefeuille et l'alimentation de la boucle d'évaluation des LLM juges —, Ecolab utilise des fonctions d'inférence par lot d'IA de Databricks comme ai_query() pour appliquer Claude à des milliers d'enregistrements en un seul appel SQL. Ce qui était auparavant un traitement séquentiel ligne par ligne s'effectue désormais en parallèle en quelques secondes, régi par les mêmes politiques Unity Catalog qui protègent l'agent en direct.

Des minutes au lieu de semaines

L'impact a été immédiat. Ce qui nécessitait auparavant deux semaines pour extraire manuellement les données de neuf systèmes cloisonnés afin de compiler un seul rapport de conformité pour un site client se fait désormais en moins de deux minutes. Une question sur le code alimentaire de la FDA qui obligeait les responsables à fouiller dans un PDF de 700 pages pendant des heures renvoie désormais une réponse citée et claire en quelques secondes.

En coulisses, neuf sources de données distinctes ont été unifiées dans un seul lakehouse gouverné, desservant des centaines de sites en Amérique du Nord lors du lancement à la mi-avril 2026. Et comme l'agent conversationnel prend en charge environ douze langues avec une précision de près de 98 %, le personnel de terrain peut interagir dans la langue avec laquelle il est le plus à l'aise.

Des insights plus rapides pour moins d'infractions

La vitesse n'est que le point de départ. La véritable valeur de la compression de deux semaines en deux minutes réside dans ce que les équipes font du temps ainsi récupéré et, plus important encore, dans les problèmes qu'elles détectent avant que ces problèmes ne se transforment en pénalités.

Un problème de nuisibles qui constitue également une violation de la sécurité alimentaire est signalé, examiné et résolu en une seule fois, plutôt que d'être découvert deux fois dans des flux de travail distincts. Pour les clients d'Ecolab, le résultat se traduit par une posture de conformité nettement améliorée, moins de pénalités et un partenaire qui fournit des informations de manière proactive plutôt que réactive. Pour Ecolab, il s'agit d'une plateforme qui renforce les relations avec les clients et transforme les données opérationnelles en un avantage concurrentiel durable.

« Ce qui prenait auparavant deux semaines, à savoir extraire des données de neuf systèmes pour compiler un seul rapport de conformité, prend désormais moins de deux minutes avec Claude sur Databricks. Notre personnel de terrain réparti sur 600 sites obtient en quelques secondes des réponses précises et sourcées, rédigées dans un langage simple, issues d'un code alimentaire de la FDA de 700 pages, et ce, dans la langue de son choix. » —Josh McCoy, Product Manager for Retail Intelligence, Ecolab

Ensuite, Ecolab prévoit d'ajouter des actions automatisées basées sur MCP — inspections de nuisibles,
réapprovisionnements en produits chimiques, normes de sécurité alimentaire et bons de travail déclenchés directement depuis l'interface de discussion — transformant ainsi le système d'une couche d'intelligence en un véritable agent opérationnel.

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.

Voir tous les blogs

De neuf silos à un moteur d'intelligence unique

Comment les agents collaborent

Des minutes au lieu de semaines

Des insights plus rapides pour moins d'infractions

Recevez les derniers articles dans votre boîte mail

Sign up