Ir para o conteúdo principal
Varejo e bens de consumo

Como a Ecolab reconstruiu a inteligência de varejo no Databricks e Anthropic Claude

Nove fontes de dados isoladas transformadas em inteligência de conformidade de varejo em tempo real em minutos.

por Babu Chinnaswamy, Nicholas Dylla, Alissa Ellingson e Harish Gaur

A Ecolab usa o Claude Sonnet e o Haiku da Anthropic nas APIs de Foundation Model do Databricks para converter manuais de segurança alimentar de 700 páginas da FDA em respostas citadas em tempo real para a equipe de varejo da linha de frente.
Desenvolvida como um Databricks App nativo com Lakebase Postgres e Unity Catalog, a solução unifica nove fontes de dados isoladas e reduz a compilação de relatórios de conformidade de duas semanas para menos de dois minutos.
Um framework de orquestração multiagente com memória de camada dupla oferece inteligência personalizada, continuamente refinada por cinco LLMs juízes e tracing do MLflow.

Quando o gerente de uma grande loja de varejo de alimentos precisa saber a temperatura correta de conservação a quente para um frango assado, a resposta está enterrada em algum lugar de um código de conduta alimentar da FDA de 700 páginas. Até recentemente, encontrar essa informação significava horas de busca manual ou uma ligação telefônica que poderia não ser retornada.

Esse era apenas um sintoma de um problema maior. A Ecolab, líder global em água, higiene e prevenção de infecções, monitora a segurança alimentar, o controle de pragas e a qualidade da água em milhares de estabelecimentos de varejo e fast-food na América do Norte. Mas os dados que alimentavam esses serviços viviam em nove sistemas separados — auditorias, inspeções de saúde, telemetria de IoT de pragas, checklists, registros de uso de produtos químicos, feeds de clima, avaliações do Yelp, dados de vizinhança do CDC e o próprio código de conduta alimentar da FDA.

"Tínhamos nove fontes de dados diferentes, nove inteligências diferentes e nenhuma maneira de ver o panorama completo de um único local" — Nicholas Dylla, líder técnico na Ecolab

A Ecolab decidiu mudar isso e construiu algo muito mais ambicioso do que um painel unificado.

De nove silos a um único mecanismo de inteligência

O aplicativo Retail Intelligence da Ecolab é um Databricks App nativo com o Lakebase Postgres como sua espinha dorsal transacional. Todas as nove fontes de dados fluem pelo Lakeflow e Spark Declarative Pipelines para um lakehouse governado sob o Unity Catalog, implantado de forma reproduzível por meio de Databricks Asset Bundles.

Como o aplicativo é executado dentro do perímetro de segurança da Databricks, a Ecolab obtém autenticação integrada, entidades de serviço automáticas e controles de acesso do Unity Catalog sem a necessidade de configurar uma infraestrutura separada. Tudo o que o usuário final vê se origina do Databricks.

Figura 1: Arquitetura do aplicativo Retail Intelligence

Mas unificar os dados era apenas metade do desafio. A verdadeira questão era: como fazer com que nove fontes de inteligência pareçam um único especialista conversacional?

A Databricks oferece à Ecolab uma plataforma única para dados, IA e governança, sem a necessidade de configurar ou gerenciar nenhuma infraestrutura de ML separada. Por meio das Foundation Model APIs, a Ecolab disponibiliza o Claude Sonnet para raciocínio complexo, o Haiku para resumos rápidos e econômicos, e o Gemini para análise de imagens, tudo a partir do mesmo plano de controle. Se um modelo melhor surgir amanhã, eles o substituem sem precisar refazer a arquitetura. Cada chamada de modelo permanece dentro do perímetro de segurança da Databricks. O Unity AI Gateway adiciona camadas de registro de payload, limitação de taxa por usuário, proteções de PII e fallbacks automáticos, enquanto o Unity Catalog governa o acesso tanto aos dados quanto aos modelos que os servem.

Disponibilizando o Claude na Databricks

No núcleo dessa estrutura está o Claude da Anthropic, disponibilizado por meio dessas mesmas Foundation Model APIs.

O Claude Sonnet atua como o principal mecanismo de raciocínio, destilando regulamentações complexas e mantendo a memória de longo prazo do usuário. O Claude Haiku lida com a sumarização, condensando o histórico de conversas a cada três turnos e destilando sinais de dados detalhados em resumos concisos, mantendo as interações rápidas e econômicas.

A Ecolab escolheu o Claude após avaliar vários provedores. O formato de resposta do modelo provou ser o mais adequado para a sumarização de conformidade, e seu tenant do Claude hospedado de forma privada atendeu a requisitos de segurança rigorosos. Ao mesmo tempo, a plataforma Databricks oferece flexibilidade multimodelo.

Como os agentes trabalham juntos

Nos bastidores, o sistema segue um padrão de Supervisor Multiagente orquestrado por meio do Databricks Workflows.

Quando o gerente de uma loja digita uma pergunta, o Agente Coordenador a divide em subtarefas e delega cada uma a um subagente especializado. Um subagente pode recuperar o trecho relevante da FDA por meio do Vector Search. Outro consulta dados de conformidade estruturados por meio de SQL e Unity Catalog Functions. Um terceiro extrai a telemetria de pragas de um servidor MCP externo. O Agente de Resposta então reúne tudo em uma única resposta com citações e persiste a interação no Lakebase.

Figure 2: Agent-to-Agent Orchestration

Figura 2: Orquestração de agente para agente

O que faz com que a experiência pareça pessoal é a arquitetura de memória de camada dupla.

Curto prazo (memória de trabalho). Cada consulta carrega os últimos dez turnos de conversa diretamente no prompt, a abordagem canônica de buffer de conversa. Para manter esse contexto enxuto à medida que a sessão cresce, Claude Haiku 4.5 executa um sumarizador em linha a cada três turnos, colapsando as trocas anteriores em um resumo denso. Prompt caching mantém o contexto ativo eficiente na transmissão, e a ferramenta de memória fornece uma transição estruturada entre o estado ativo e o estado persistente.

Longo prazo (memória semântica). Entre as sessões, Claude Sonnet 4.6 mantém um perfil por usuário (função, preferências, áreas de foco recorrentes, contexto de localização e padrões de comportamento). Os perfis são armazenados como registros estruturados e atualizados continuamente à medida que o usuário interage. Isso reflete o padrão de memória de longo prazo.

O efeito combinado: um gerente de loja que retorna após semanas de ausência abre o assistente e obtém respostas que já compreendem seu território, seus chamados abertos e seu fluxo de trabalho, sem a necessidade de novos prompts, apresentações ou explicações sobre quem ele é.

Figure 3: Query Architecture & Memory Payload Flow

Figura 3: Arquitetura de consulta e fluxo de payload de memória

A qualidade nunca é estática. Cinco LLMs avaliadores avaliam cada interação em várias dimensões. O feedback do usuário se combina com sinais implícitos para alimentar um loop automatizado de otimização de prompts. O MLflow rastreia cada caminho de execução, enquanto os painéis monitoram a latência e as taxas de erro em tempo real. A equipe até analisa logs de consulta para criar perguntas padrão melhores com base no que os gerentes realmente perguntam.

As respostas do agente em tempo real são apenas metade da história. Para cargas de trabalho offline de alto volume — como a pontuação retroativa de inspeções históricas, geração de resumos de conformidade para todo o portfólio e alimentação do loop de avaliação de LLMs avaliadores —, a Ecolab usa funções de inferência em lote de IA da Databricks, como ai_query(), para aplicar o Claude em milhares de registros em uma única chamada SQL. O que costumava ser um processamento sequencial linha por linha agora é concluído em paralelo em segundos, governado pelas mesmas políticas do Unity Catalog que protegem o agente ativo.

Minutos em vez de semanas

O impacto foi imediato. O que antes levava duas semanas para extrair dados manualmente de nove sistemas isolados para compilar um único relatório de conformidade para o local de um cliente, agora é concluído em menos de dois minutos. Uma pergunta sobre o código de conduta alimentar da FDA que fazia os gerentes vasculharem um PDF de 700 páginas por horas agora retorna uma resposta com citações e em linguagem simples em segundos.

Nos bastidores, nove fontes de dados separadas foram unificadas em um único lakehouse governado, atendendo a centenas de locais na América do Norte no lançamento em meados de abril de 2026. E como o agente conversacional oferece suporte a aproximadamente doze idiomas com cerca de 98% de precisão, a equipe de linha de frente pode interagir no idioma em que se sentir mais confortável.

De insights mais rápidos a menos violações

A velocidade é apenas o ponto de partida. O valor real de comprimir duas semanas em dois minutos é o que as equipes fazem com o tempo que ganham de volta e, mais importante, os problemas que detectam antes que esses problemas se tornem penalidades.


Um problema de pragas que também é uma violação de segurança alimentar é sinalizado, investigado e resolvido de uma só vez, em vez de ser descoberto duas vezes em fluxos de trabalho separados. Para os clientes da Ecolab, o resultado é uma postura de conformidade mensuravelmente melhor, menos eventos de penalidade e um parceiro que entrega inteligência de forma proativa, em vez de reativa. Para a Ecolab, é uma plataforma que aprofunda o relacionamento com os clientes e transforma dados operacionais em uma vantagem competitiva duradoura.

"O que costumava levar duas semanas, extraindo dados de nove sistemas para compilar um único relatório de conformidade, agora leva menos de dois minutos com o Claude no Databricks. Nossa equipe de linha de frente em 600 locais obtém respostas citadas e em linguagem simples de um código de alimentos da FDA de 700 páginas em segundos, no idioma em que se sentirem mais confortáveis." — Josh McCoy, Gerente de Produto de Inteligência de Varejo, Ecolab

Em seguida, a Ecolab planeja adicionar ações automatizadas baseadas em MCP — inspeções de pragas,
pedidos de produtos químicos, normas de segurança alimentar e ordens de serviço acionadas diretamente da interface de chat — transformando o sistema de uma camada de inteligência em um Agente operacional completo.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.