Una conversación con el Director de Datos de Trinity Industries, Stephen Ecker, sobre cómo una empresa ferroviaria de 90 años construyó IA que funciona priorizando primero la base
por Aly McGue
Cada empresa quiere ser impulsada por IA. Pocas están dispuestas a hacer el trabajo poco glamoroso en la capa de datos. Las organizaciones que avanzan primero crean una base de datos sólida y construyen inteligencia sobre algo en lo que realmente confían.
Trinity Industries es uno de los mayores fabricantes y arrendadores de vagones de ferrocarril de América del Norte, gestionando una flota arrendada de más de 141.000 vagones de ferrocarril valorados en alrededor de 8.500 millones de dólares. Transportando más de 900 productos básicos, la empresa opera en la intersección de la industria pesada y los servicios financieros. Trinity opera su plataforma unificada de datos e IA en Databricks, habiendo migrado el 95% de sus datos empresariales a una única arquitectura de lakehouse.
Stephen Ecker es el Director de Datos en Trinity Industries, donde ha pasado 13 años y fundó la función de análisis de la empresa. Construyó el equipo desde un grupo de pasantes hasta una capacidad estratégica que ha generado más de 100 millones de dólares en impacto comercial medible.
A lo largo de nuestra conversación, Stephen volvió a una sola convicción: la capa de datos es la estrategia. No el modelo, no el agente, no el panel. La base.
El coste de la fragmentación
Aly McGue: Los líderes empresariales a menudo sopesan el coste de transformar completamente su infraestructura frente al coste de no modernizar. ¿Cómo abordaste esto y por qué la fragmentación de datos fue finalmente tan costosa?
Stephen Ecker: No fue solo un problema de TI. Fue un techo estratégico para nosotros. Teníamos cargas de trabajo rebotando entre Azure y AWS, de vuelta a on-prem. Cada modelo que desplegábamos tenía su propia configuración de servicio. Nada estaba estandarizado. Teníamos un almacén SQL local donde ejecutabas una consulta durante la noche sobre datos de ubicación de vagones, volvías a la mañana siguiente, te dabas cuenta de que habías cometido un error y tenías que volver a ejecutarla la noche siguiente. Eso son dos días para responder una pregunta.
Pero el mayor coste fue la expansión del análisis. Empezamos con paneles porque nadie tenía acceso a ningún dato, y fueron muy populares. Pero con el tiempo, un panel de tres hojas se convirtió en un panel de 40 hojas, cada una con sus propias transformaciones incorporadas. Calculamos que teníamos casi 600 medidas distintas en todo el negocio. Muchas de ellas partían de la misma fuente de datos pero tenían sus propios filtros, su propia lente. Y luego estaba el silo de conocimiento. Un analista pasaba dos días en un trabajo, y seis meses después, otra persona empezaba el mismo análisis desde cero. En un momento dado, sentí que mi mayor valor era simplemente haber estado aquí 13 años y saber quién ya había hecho qué.
El debate "¿qué número es el correcto?"
Aly: Sin una capa de datos única, las organizaciones a menudo se enfrentan al dilema de "¿qué número es el correcto?", donde los datos de diferentes departamentos no coinciden. ¿Cómo afectó esta falta de una "única fuente de verdad" a la confianza de su liderazgo en los datos que estaban viendo?
Stephen: Fue constante. Alguien aparecía con un número, y luego se necesitaba un experto para investigar el código y decir: 'No, a ese número se le aplicaron estos filtros porque eso es lo que quería una persona específica hace tres años'. Incluso cuando intentamos poner advertencias y redacción técnica dentro de los paneles, no funcionó. La gente no lee las notas a pie de página. Simplemente cogen un número y se van con él.
Estábamos registrando 11.000 horas al mes en estos paneles. Y seguíamos intentando consolidarlos, pero en realidad nunca consolidábamos nada porque la demanda de más alcance de los paneles nunca se detenía. Así que durante la migración, tomamos una decisión difícil. Fuimos a la arquitectura Medallion, movimos todas las transformaciones de nuevo hacia arriba y empezamos a desechar los paneles heredados. No deberías tener 600 medidas, incluso en un negocio multimillonario. Necesitábamos las medidas principales y luego una vía para que la gente hiciera su propio análisis sobre eso.
Desbloqueo de la IA a través de la consolidación
Aly: ¿Cómo ha desbloqueado la consolidación de su plataforma tanto análisis mejorados como modelos avanzados de IA de una manera que no era posible antes?
Stephen: El ángulo de la IA generativa es uno importante. Los datos no estructurados, cosas como correos electrónicos, de repente se volvieron realmente importantes. La otra cosa que nos dio la consolidación es el acceso a modelos sin la sobrecarga. No tenemos que debatir la configuración de una API separada a OpenAI o pasar por revisiones legales y arquitectónicas cada vez que queremos probar algo. Tenemos todas las protecciones proporcionadas por Databricks, y podemos acceder a los modelos que necesitamos bajo un paraguas seguro único. Esa flexibilidad para experimentar sin un proceso de adquisición cada vez es enorme para nosotros.
Ahora también tenemos agentes interactuando con más de mil millones de dólares en nuestra cadena de suministro de adquisiciones de fabricación. Se ponen en contacto con los proveedores por correo electrónico, sintetizan dónde se encuentra el inventario dentro del proceso de órdenes de compra, haciendo un seguimiento automático. Vimos un aumento inmediato del 15% en la entrega de materiales a tiempo. Cuando piensas que cada 10 millones de dólares de mejora del capital circulante supone aproximadamente 1 millón de dólares de beneficio neto, eso se suma rápidamente.
Inteligencia en tiempo real a escala
Aly: ¿Dónde has visto que los insights en tiempo real han tenido el mayor impacto estratégico en tus operaciones, y cuál fue el desafío arquitectónico para ofrecer esa fiabilidad e inteligencia?
Stephen: Nuestro modelo de predicción de ETA. Ese es nuestro desafío más técnico. Los vagones de ferrocarril en América del Norte son rastreados por lectores de etiquetas AEI, básicamente reflectores en el lateral del vagón que emiten señales aproximadamente cada 10 millas. Así que sabes que un vagón está en Dallas, pero no dónde en Dallas. El GPS te da más precisión, pero es complicado. Alrededor del 20% de los datos de la industria se informan incorrectamente. El GPS se desvía.
Tuvimos que construir un algoritmo de limpieza en tiempo real y un proceso de suavizado de trayectorias que ajusta las lecturas de GPS a la vía correcta analizando el historial de viajes reciente. Todos esos datos de streaming se unifican en una arquitectura única, se transforman y luego se alimentan a un modelo de IA que actualiza las ETA en cuestión de segundos. Nuestro modelo es ahora un 50% más preciso que las ETA de la propia industria, y ni siquiera controlamos las locomotoras.
El cuello de botella del analista desaparece.
Aly: Uno de los mayores obstáculos para el liderazgo es el tiempo de retraso entre hacer una pregunta y obtener una respuesta basada en datos. ¿Cómo ha ayudado la interfaz de lenguaje natural de Databricks Genie a tu equipo a evitar la tradicional "cola de analistas"?
Stephen: Los primeros en adoptar Genie no fueron los ejecutivos, en realidad. Fue mi propio equipo de analistas. Estaban haciendo trabajo operativo repetitivo, respondiendo a preguntas de las partes interesadas y dedicando uno o dos días a análisis. Una vez que empezaron a usar las salas de Genie, pudieron obtener una respuesta más clara y concisa en 30 minutos. Esa fue la señal para nosotros.
A partir de ahí, se extendió. Nuestro CFO ahora está haciendo preguntas sobre datos de planificación financiera en salas de Genie. Nuestro CEO, que fue CTO en Caterpillar, está totalmente involucrado. Construimos una aplicación de cliente 360 que extrae datos de 9 dominios y sintetiza resúmenes de clientes. Los vendedores que nunca tocaron un panel lo están usando porque es así de fácil profundizar. Ya estamos superando las mil preguntas al mes, y estamos reestructurando toda nuestra capa de BI en torno a este enfoque.
De solicitar datos a conversar con ellos
Aly: ¿Cómo proporciona una experiencia de análisis conversacional a los usuarios de negocio no técnicos un cambio en la cultura de su organización de "solicitar datos" a "conversar con datos"?
Stephen: Curiosidad. Esa es la respuesta honesta a lo que todavía es difícil. A todo el mundo le gusta la fruta madura. Pueden obtener una respuesta, extraer un conjunto de datos y saltarse la navegación del panel. Pero queremos que profundicen, que se den cuenta de que ahora son tan capaces como los analistas y que empiecen a hacer preguntas más difíciles.
Recuerdo una medida a nivel de junta directiva que creamos hace años comparando los costes de mantenimiento entre diferentes talleres en nuestra flota de alquiler. Nos llevó semanas. Una de las primeras cosas que hice con una sala de Genie fue pedirle que hiciera el mismo análisis. Llegó a la misma respuesta en cinco minutos, utilizando la misma metodología, e incluso fue lo suficientemente inteligente como para señalar tamaños de muestra pequeños como anómalos. Ese es un análisis complejo que no podríamos haber soñado hace ocho años. Ahora se necesitan tres indicaciones. Es como, wow, eso es realmente impresionante.
Fuimos lo suficientemente inteligentes como para empezar pronto también en el lado de la adopción. Incorporamos Microsoft Copilot en los primeros meses, no porque pensáramos que haría a todo el mundo más eficiente de la noche a la mañana, sino porque teníamos que conseguir que la gente hiciera indicaciones. Teníamos que conseguir que pensaran en un LLM como una persona, no como un motor de búsqueda. Así que dentro de dos años, no estaremos todavía enseñando a la gente a hacer una pregunta. Esa inversión temprana en alfabetización de indicaciones está dando sus frutos ahora.
Consejo para líderes que inician este trabajo
Aly: Si tuvieras un consejo para un líder de nivel C que intenta preparar a su organización para el futuro de la IA, ¿cuál sería?
Stephen: No construyas IA sobre una base rota. La capa de datos es la estrategia.
Puedes poner en marcha pruebas de concepto (POC) muy rápidamente con los modelos más recientes. Pero el ganador de todo esto será quien tenga las bases más sólidas, quien realmente haya invertido en la capa de datos. La tentación es perseguir el caso de uso de IA más emocionante. Tienes que resistir eso. Haz el trabajo duro. Nuestra migración fue dolorosa. Nos llevó cerca de un año, y luego otros seis a ocho meses después de eso para consolidar todo. Pero la IA es tan buena como los datos sobre los que se ejecuta. Si quieres basarla en tus propios datos, automatizar flujos de trabajo reales y escalar con confianza, todo comienza con la base. No significa que no puedas obtener algunas victorias rápidas en el camino. Pero si realmente quieres acelerar el negocio, está en la base.
Reflexiones finales
Lo que más destaca de esta conversación es cómo Stephen conecta directamente cada victoria de IA con la misma decisión: arreglar primero la capa de datos. El modelo ETA, los agentes de adquisiciones, el cambio a análisis conversacional, nada de esto habría sido posible sin el compromiso de Trinity con una migración dolorosa de un año que la mayoría de las organizaciones intentan evitar.
Las empresas que liderarán en IA empresarial no son las que tienen los prototipos más llamativos. Son las que están dispuestas a hacer el trabajo estructural y luego construir inteligencia sobre algo que realmente controlan. Para esta empresa de 90 años, que mueve mercancías físicas a través de un continente, esa claridad vale la pena prestarle atención.
Para obtener más información sobre cómo crear una hoja de ruta práctica para avanzar en tus capacidades de IA, descarga el Modelo de Madurez de IA de Databricks.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.