Ir al contenido principal

Cómo Ecolab reconstruyó la inteligencia de retail en Databricks y Anthropic Claude

De 9 fuentes de datos aisladas a inteligencia de cumplimiento minorista en tiempo real en cuestión de minutos.

por Babu Chinnaswamy, Nicholas Dylla, Alissa Ellingson y Harish Gaur

Ecolab utiliza Claude Sonnet y Haiku de Anthropic en Databricks Foundation Model APIs para convertir manuales de seguridad alimentaria de la FDA de 700 páginas en respuestas con citas y en tiempo real para el personal de primera línea en tiendas minoristas.
Creada como una Databricks App nativa con Lakebase Postgres y Unity Catalog, la solución unifica nueve fuentes de datos aisladas y reduce la compilación de informes de cumplimiento de dos semanas a menos de dos minutos.
Un marco de orquestación multiagente con memoria de doble capa ofrece inteligencia personalizada, refinada continuamente por cinco LLMs jueces y el seguimiento de MLflow.

Cuando el gerente de una tienda de un importante minorista de alimentos necesita saber la temperatura correcta de conservación en caliente para un pollo asado, la respuesta está enterrada en algún lugar de un código de alimentos de la FDA de 700 páginas. Hasta hace poco, encontrarla significaba horas de búsqueda manual o una llamada telefónica que podría no ser devuelta.

Ese era solo un síntoma de un problema mayor. Ecolab, un líder mundial en agua, higiene y prevención de infecciones, monitorea la seguridad alimentaria, el control de plagas y la calidad del agua en miles de establecimientos minoristas y de comida rápida en toda Norteamérica. Pero los datos que impulsaban esos servicios residían en nueve sistemas independientes: auditorías, inspecciones sanitarias, telemetría IoT de plagas, listas de verificación, registros de uso de productos químicos, datos meteorológicos, reseñas de Yelp, datos vecinales del CDC y el propio código de alimentos de la FDA.

"Teníamos nueve fuentes de datos diferentes, nueve inteligencias distintas y ninguna forma de ver el panorama completo de una sola ubicación" — Nicholas Dylla, líder técnico en Ecolab

Ecolab se propuso cambiar eso y creó algo mucho más ambicioso que un panel de control unificado.

De nueve silos a un solo motor de inteligencia

La aplicación Retail Intelligence de Ecolab es una Databricks App nativa con Lakebase Postgres como su columna vertebral transaccional. Las nueve fuentes de datos fluyen a través de Lakeflow y Spark Declarative Pipelines hacia un lakehouse gobernado bajo Unity Catalog, desplegado de manera reproducible a través de Databricks Asset Bundles.

Debido a que la aplicación se ejecuta dentro del perímetro de seguridad de Databricks, Ecolab obtiene autenticación integrada, principales de servicio automáticos y controles de acceso de Unity Catalog sin necesidad de implementar una infraestructura independiente. Todo lo que ve el usuario final proviene de Databricks.

Figura 1: Arquitectura de la aplicación Retail Intelligence

Pero unificar los datos era solo la mitad del desafío. La verdadera pregunta era: ¿cómo hacer que nueve fuentes de inteligencia se sientan como un único experto conversacional?

Databricks le ofrece a Ecolab una plataforma única para datos, AI y gobernanza sin necesidad de implementar ni administrar una infraestructura de ML independiente. A través de Foundation Model APIs, Ecolab sirve Claude Sonnet para razonamiento complejo, Haiku para resúmenes rápidos y rentables, y Gemini para análisis de imágenes, todo desde el mismo plano de control. Si mañana surge un modelo mejor, lo reemplazan sin tener que rediseñar la arquitectura. Cada llamada al modelo permanece dentro del perímetro de seguridad de Databricks. El Unity AI Gateway añade capas de registro de payload, limitación de velocidad por usuario, barreras de seguridad para PII y respaldos automáticos, mientras que Unity Catalog gobierna el acceso tanto a los datos como a los modelos que los sirven.

Servir Claude en Databricks

En el núcleo de este marco de trabajo se encuentra Claude de Anthropic, servido a través de esas mismas Foundation Model APIs.

Claude Sonnet actúa como el motor de razonamiento principal, sintetizando regulaciones complejas y manteniendo la memoria a largo plazo del usuario. Claude Haiku se encarga de la generación de resúmenes, condensando el historial de conversación cada tres turnos y sintetizando señales de datos detalladas en informes concisos, al tiempo que mantiene las interacciones rápidas y rentables.

Ecolab eligió Claude después de evaluar a múltiples proveedores. El formato de respuesta del modelo demostró ser el más adecuado para los resúmenes de cumplimiento, y su instancia privada de Claude cumplió con los estrictos requisitos de seguridad. Al mismo tiempo, la plataforma Databricks les brinda flexibilidad multimodelo.

Cómo trabajan juntos los agentes

Internamente, el sistema sigue un patrón de supervisor multiagente orquestado a través de Databricks Workflows.

Cuando el gerente de una tienda escribe una pregunta, el Agente Coordinador la divide en subtareas y delega cada una a un subagente especializado. Un subagente podría recuperar el fragmento relevante de la FDA a través de Vector Search. Otro consulta datos de cumplimiento estructurados a través de SQL y funciones de Unity Catalog. Un tercero extrae telemetría de plagas de un servidor MCP externo. Luego, el Agente de Respuesta reúne todo en una sola respuesta con citas y persiste la interacción en Lakebase.

Figura 2: Orquestación de agente a agente

Figura 2: Orquestación de agente a agente

Lo que hace que la experiencia se sienta personal es la arquitectura de memoria de doble capa.

A corto plazo (memoria de trabajo). Cada consulta lleva los últimos diez turnos de conversación directamente en el prompt, el enfoque canónico de búfer de conversación. Para mantener ese contexto acotado a medida que crece la sesión, Claude Haiku 4.5 ejecuta un generador de resúmenes en línea cada tres turnos, sintetizando los intercambios anteriores en un resumen denso. El Prompt caching mantiene el contexto activo eficiente en la transmisión, y la herramienta de memoria proporciona un traspaso estructurado entre el estado activo y el estado persistente.

A largo plazo (memoria semántica). Entre sesiones, Claude Sonnet 4.6 mantiene un perfil por usuario (rol, preferencias, áreas de enfoque recurrentes, contexto de ubicación y patrones de comportamiento). Los perfiles se almacenan como registros estructurados y se actualizan continuamente a medida que el usuario interactúa. Esto refleja el patrón de memoria a largo plazo.

El efecto combinado: un gerente de tienda que regresa después de semanas de ausencia abre el asistente y obtiene respuestas que ya entienden su territorio, sus tickets abiertos y su flujo de trabajo sin necesidad de volver a escribir prompts, volver a presentarse o volver a explicar quién es.

Figura 3: Arquitectura de consultas y flujo de carga útil (payload) de memoria

Figura 3: Arquitectura de consultas y flujo de carga útil (payload) de memoria

La calidad nunca es estática. Cinco LLM jueces evalúan cada interacción en múltiples dimensiones. Los comentarios de los usuarios se combinan con señales implícitas para alimentar un bucle de optimización de prompts automatizado. MLflow rastrea cada ruta de ejecución, mientras que los paneles de control realizan un seguimiento de la latencia y las tasas de error en tiempo real. El equipo incluso analiza los registros de consultas para crear mejores preguntas predeterminadas basadas en lo que los gerentes realmente preguntan.

Las respuestas de los agentes en tiempo real son solo la mitad de la historia. Para cargas de trabajo fuera de línea de gran volumen (como la calificación retroactiva de inspecciones históricas, la generación de informes de cumplimiento para toda la cartera y la alimentación del bucle de evaluación de los LLM jueces), Ecolab utiliza funciones de inferencia por lotes de Databricks AI como ai_query() para aplicar Claude en miles de registros en una sola llamada SQL. Lo que antes era un procesamiento secuencial fila por fila ahora se completa en paralelo en segundos, gobernado por las mismas políticas de Unity Catalog que protegen al agente en vivo.

Minutos en lugar de semanas

El impacto fue inmediato. Lo que antes requería dos semanas para extraer manualmente datos de nueve sistemas en silos con el fin de compilar un único informe de cumplimiento para la ubicación de un cliente, ahora se completa en menos de dos minutos. Una pregunta sobre el código de alimentos de la FDA que antes hacía que los gerentes buscaran durante horas en un PDF de 700 páginas, ahora devuelve una respuesta con citas y en lenguaje sencillo en segundos.

Detrás de escena, nueve fuentes de datos independientes se han unificado en un único lakehouse gobernado, que atiende a cientos de ubicaciones en Norteamérica en su lanzamiento a mediados de abril de 2026. Y debido a que el agente conversacional admite aproximadamente doce idiomas con una precisión de alrededor del 98 %, el personal de primera línea puede interactuar en el idioma con el que se sienta más cómodo.

De información más rápida a menos infracciones

La velocidad es solo el punto de partida. El verdadero valor de comprimir dos semanas en dos minutos es lo que los equipos hacen con el tiempo que recuperan y, lo que es más importante, los problemas que detectan antes de que se conviertan en penalizaciones.


Un problema de plagas que también es una infracción de seguridad alimentaria se marca, investiga y resuelve una sola vez, en lugar de descubrirse dos veces en flujos de trabajo independientes. Para los clientes de Ecolab, el resultado es una postura de cumplimiento notablemente mejor, menos eventos de penalización y un socio que ofrece inteligencia de manera proactiva en lugar de reactiva. Para Ecolab, es una plataforma que profundiza las relaciones con los clientes y convierte los datos operativos en una ventaja competitiva duradera.

"Lo que antes tomaba dos semanas, extrayendo datos de nueve sistemas para compilar un solo informe de cumplimiento, ahora toma menos de dos minutos con Claude en Databricks. Nuestro personal de primera línea en 600 ubicaciones obtiene respuestas citadas y en lenguaje sencillo de un código alimentario de la FDA de 700 páginas en segundos, en el idioma en el que se sientan más cómodos." — Josh McCoy, Product Manager de Retail Intelligence, Ecolab

A continuación, Ecolab planea agregar acciones automatizadas impulsadas por MCP: inspecciones de plagas,
repedidos de productos químicos, normas de seguridad alimentaria y órdenes de trabajo activadas directamente desde la interfaz de chat, lo que convertirá el sistema de una capa de inteligencia en un agente operativo completo.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.