Ir al contenido principal

Los bancos no tienen un problema de IA, tienen un problema de plataforma de datos

Por qué se estanca la IA en la banca y cómo las plataformas de datos permiten IA escalable y gobernada en producción

Blog post CBA Live recap

Publicado: 17 de abril de 2026

Servicios financieros10 min de lectura

Summary

  • Los bancos tienen datos de clientes más ricos que casi cualquier otra institución, pero los sistemas fragmentados y la gobernanza débil impiden que la IA vaya más allá de las fases piloto y llegue a producción.
  • CBA Live 2026 reveló un patrón consistente en riesgo, cobranzas y banca relacional: el factor limitante no es la capacidad de la IA, sino la base de datos y gobernanza necesaria para soportarla.
  • Databricks Lakehouse, Unity Catalog y Agent Bricks abordan directamente los desafíos de calidad de datos, monitoreo de modelos, personalización en tiempo real e IA agéntica con los que los bancos luchan hoy en día.

Bajo el lema “Avanzar”, CBA Live 2026 reunió a varios cientos de líderes de banca minorista enfocados en superar la complejidad y avanzar en la innovación.

Pero en cada sesión –riesgos, cumplimiento, cobranzas y crecimiento de depósitos– el mismo tema subyacente seguía surgiendo:

La innovación en IA no escala sin una base sólida de datos y gobernanza.

Debajo de las demostraciones y los planes de desarrollo, surgió un patrón común. Los bancos que están avanzando realmente no son los que tienen la IA más llamativa.

Son los que tienen las bases de datos más limpias, mejor gobernadas y en tiempo real.

El Escenario Que Marcó la Pauta:

La conferencia magistral de la presidenta de CBA, Lindsay Johnson, describió una experiencia de consumidor casi futura que sonaba simple e inevitable.

Un consumidor se despierta el día de pago. Para cuando toma su teléfono, todo ya está hecho: facturas pagadas, ahorros asignados, suscripciones renovadas, incluso una transferencia enviada al extranjero.

Sin aplicaciones. Sin inicios de sesión. Sin decisiones que tomar.

Un agente de IA se encargó de todo.

Ese es el futuro hacia el que los bancos están construyendo.

Pero aquí está la pregunta incómoda que no se hizo en el escenario:

¿Qué tendría que estar implementado dentro de un banco para que esa experiencia funcione realmente?

Porque esta no es solo una mejor experiencia digital. Es un modelo operativo fundamentalmente diferente. Uno donde los agentes externos interactúan con sus sistemas en tiempo real, a través de productos, con contexto completo y cero tolerancia a la inconsistencia o el retraso.

Y para la mayoría de las instituciones, ahí es donde se muestra la brecha.

No en la ambición o los modelos que están construyendo, sino en la base de datos necesaria para hacerlo realidad.

Lo Que Escuchamos en las Sesiones:

A lo largo de las diversas sesiones, los desafíos específicos de datos variaron según la función, pero el tema subyacente fue consistente.

Riesgos y Cumplimiento de IA: La Brecha de Gobernanza es Real

Panelistas de múltiples instituciones hablaron sobre cómo la deriva del modelo –la degradación silenciosa de un modelo de IA a medida que la población del mundo real sobre la que fue entrenado cambia– es uno de los riesgos menos apreciados en la IA bancaria. Un modelo de calificación crediticia entrenado con un grupo de solicitantes con un FICO promedio de 750 puede fallar silenciosamente cuando la mezcla de solicitantes cambia a 650. Necesita desencadenadores automáticos que vigilen esto continuamente. La mayoría de los bancos no los tienen.

La disciplina de calidad de datos requerida para la gobernanza de IA también es más exigente de lo que muchos equipos de cumplimiento anticiparon. La auditoría interna ahora necesita probar de forma independiente el linaje de datos y no solo aceptar las atestaciones de las unidades de negocio. El regulador no aceptará "el socio fintech posee el modelo" como respuesta.

Banca Relacional: Los Datos Más Ricos de Cualquier Industria, Inactivos

Múltiples sesiones hicieron la misma observación de que los bancos tienen datos más ricos sobre sus clientes que casi cualquier otra institución – más que un médico, más que un asesor financiero. Saben sobre membresías de gimnasio, pagos médicos recurrentes, volatilidad de gastos y patrones de depósito de empleadores. Pero la mayoría de esa información está fragmentada en sistemas que no se comunican entre sí en tiempo real.

La fricción que esto crea es real. Un panelista describió el objetivo de conocer a un cliente lo suficientemente bien como para detectar que aún no había presentado sus impuestos, y presentar proactivamente esa información en el momento exacto. Ese tipo de personalización requiere datos limpios, unificados y accesibles en tiempo real. No es una característica de producto que se pueda añadir.

Gestión de Incumplimiento: La Base es Clave

Una sesión sobre IA en cobranzas describió lo que es posible cuando la base de datos es correcta. Predecir, con un 85% de precisión, cuántos días tardará en curarse una cuenta recién morosa, a partir del Día 1 de la morosidad. Esa señal temprana cambia por completo cómo se asignan los recursos de cobranza.

Llegar allí requiere no solo datos de cuentas internas, sino la capacidad de unir señales de participación digital (¿visitó el cliente el sitio web sin pagar?), datos de migración de buró de crédito, comportamiento de depósitos y patrones de resolución históricos, todo de manera gobernada y auditable. Las instituciones que lo hacen bien construyeron primero la infraestructura de datos. La capacidad de IA siguió.

IA de Primera Línea: La IA construida sobre Modelos Genéricos Decae

La sesión de Bank of America sobre Erica fue una clase magistral de lo que realmente es la IA de producción a escala. Erica ha manejado más de 3.2 mil millones de interacciones con clientes desde su lanzamiento en 2018 y ha realizado miles de cambios en el camino. La lección de ocho años de IA de producción fue clara: esta no es una tecnología de "configurar y olvidar". Requiere ajuste continuo de datos, monitoreo continuo y un equipo cuyo único trabajo es leer los casos extremos y actualizar el modelo.

Otra sesión reforzó esto desde un ángulo diferente: los agentes del centro de contacto en la mayoría de los bancos alternan entre 10 a 15 aplicaciones para responder una sola pregunta del cliente. Los agentes de IA que resolverán ese problema son aquellos basados en los propios datos del banco. No en LLMs genéricos, sino herramientas entrenadas en las políticas, productos y relaciones con los clientes del banco.

Informe

La guía de IA agéntica para la empresa

La Realidad de los Proveedores:

Una de las sesiones más memorables fue una evaluación franca del panorama de proveedores de IA. Un orador que había liderado la estrategia de IA en una institución importante compartió un hallazgo de una auditoría de proveedores a gran escala: de varios miles de proveedores que actualmente afirman tener capacidades de IA, solo alrededor del 5% tiene IA genuina en el producto. El resto está reetiquetando la automatización robótica de procesos o la lógica de automatización estándar como IA.

La guía práctica para los compradores de tecnología bancaria es ser específicos. Pregunte cómo el proveedor desarrolló su capacidad de IA. Pregunte qué orquestación de LLM están utilizando. Pregunte si tienen cobertura completa de API y MCP. Pregunte cómo se verá su negocio en tres años a medida que la automatización del flujo de trabajo se convierta en un producto básico. Si no pueden responder esas preguntas específicamente, usted tiene su respuesta.

Por Qué Esto Importa y Dónde Lo Vemos Funcionar:

Los temas que surgieron de CBA Live no eran nuevos. Reflejan de cerca los mismos desafíos que vemos en las conversaciones continuas con clientes bancarios: entornos de datos fragmentados, gobernanza limitada e iniciativas de IA que luchan por pasar de las fases piloto a la producción.

Esto valida un patrón que continúa surgiendo en las instituciones con las que interactuamos a diario: **el factor limitante no es la capacidad de IA, sino la base de datos y gobernanza subyacente necesaria para respaldarla.**

Conectemos los temas que escuchamos con cómo Databricks los aborda:

El Problema de la Base de Datos

Los bancos luchan por escalar la IA porque **los datos de clientes, riesgos y productos están fragmentados e inconsistentes**. El Lakehouse de Databricks centraliza datos por lotes y en streaming, mientras que Unity Catalog agrega una capa de gobernanza (permisos, linaje y clasificación) para que cada equipo trabaje desde la misma vista confiable.

Con Lakeflow, los bancos pueden ingerir y transformar datos de manera confiable en capas curadas, en lugar de depender de canalizaciones frágiles punto a punto. Luego, Lakebase extiende esta base a cargas de trabajo transaccionales, lo que incorpora un motor Postgres completamente administrado en la misma plataforma gobernada, para que las aplicaciones operativas y los agentes de IA puedan compartir datos con análisis sin crear un estado OLTP separado y opaco.

El Problema de la Deriva y Monitoreo de Modelos

Bajo directrices como SR 11-7, los reguladores ahora esperan gestión de riesgos de modelos de ciclo de vida completo. No solo validación inicial, sino monitoreo continuo, detección de deriva y revalidación periódica para modelos materiales.

En Databricks, MLflow y el Model Registry rastrean experimentos y versiones aprobadas, mientras que Model Monitoring y Delta Lake capturan predicciones, entradas y resultados a lo largo del tiempo. Eso hace que la validación al estilo SR 11-7 y las comprobaciones de rendimiento continuas sean una parte estándar de la plataforma, en lugar de un conjunto de scripts y hojas de cálculo. Para modelos de alto impacto, como los que impulsan las predicciones de morosidad o la segmentación de fraude, estas capacidades se están convirtiendo rápidamente en requisitos básicos en lugar de características "avanzadas".

El Problema de la Personalización en Tiempo Real

Para interactuar con los clientes “en el momento”, los bancos necesitan características frescas y de baja latencia, no solo agregados nocturnos. El Online Feature Store de Databricks sirve características precalculadas (propensión, indicadores de riesgo, segmentos) en milisegundos, mientras que Lakebase proporciona el contexto operativo más reciente, como transacciones recientes, dentro del mismo límite de gobernanza.

Un flujo típico se vería como un evento (tarjeta deslizada, inicio de sesión en la aplicación, llamada) que activa un servicio de decisión que lee características del Online Feature Store, une el contexto de Lakebase y devuelve una acción siguiente óptima, de manera consistente, en todos los canales. Para el personal de primera línea, Genie expone los mismos datos y métricas gobernados a través del lenguaje natural, para que los banqueros y agentes puedan hacer preguntas como “¿Cuál es la tendencia de depósitos a 90 días de este cliente?” sin tickets ni extracciones ad hoc, mientras Unity Catalog aplica políticas y linaje por debajo.

El problema de la IA Agentic

La IA Agentic en la banca significa agentes que pueden realizar acciones restringidas, como avanzar un flujo de trabajo de cobros, iniciar pasos de KYC u orquestar llamadas de servicio bajo estrictas directrices y supervisión.

En Databricks, Agent Bricks orquesta estos agentes y llamadas a herramientas. Databricks Apps aloja las interfaces de usuario y los flujos de trabajo seguros en los que se integran. Lakehouse + Unity Catalog controla qué datos pueden ver los agentes, con linaje completo y pistas de auditoría. El Online Feature Store les proporciona señales de comportamiento y riesgo en tiempo real, y Lakebase sirve como su almacén de estado operativo para lecturas/escrituras de baja latencia, todo dentro del mismo perímetro de seguridad y gobernanza.

Eso permite a los bancos escalar flujos de trabajo agentic en una plataforma que registra cada acción y se mantiene explicable y auditable.

El problema de la explicabilidad y el cumplimiento

A los reguladores les importa menos cuán “avanzado” es un modelo y más si el banco puede explicar, gobernar y evidenciar su uso.

Databricks aborda esto haciendo de la gobernanza y el linaje elementos de primera clase.

Unity Catalog unifica permisos, linaje e historial de auditoría en artefactos de datos, características y modelos. Delta Lake y Databricks SQL proporcionan canalizaciones versionadas y reproducibles, y MLflow Model Registry + Model Monitoring capturan versiones de modelos, aprobaciones y rendimiento/desviación a lo largo del tiempo.

Eso brinda a los bancos un registro completo y reconstruible de cómo fluyen los datos, cómo se crearon y validaron los modelos, y cómo influyeron en las decisiones, convirtiendo la explicabilidad y el cumplimiento en un facilitador para la implementación de IA más rápida, segura y responsable.

Conclusión:

Los bancos no tienen un problema de IA; tienen un problema de plataforma de datos.

El patrón es claro: las soluciones puntuales muestran promesas tempranas, pero sin una base de datos sólida y gobernada, se estancan. Las instituciones que ven resultados reales son las que invirtieron primero en la plataforma, haciendo que cada caso de uso de IA sea más rápido de implementar, más fácil de confiar y defendible ante los reguladores. La plataforma no es una decisión posterior; es el punto de partida

Preguntas dignas de llevar a su equipo:

  • ¿Tenemos una única fuente de verdad gobernada, o los equipos trabajan con diferentes versiones de datos?
  • ¿Qué tan rápido detectamos cuándo falla un modelo en producción?
  • ¿Podemos explicarle hoy a un regulador cualquier decisión impulsada por IA, de extremo a extremo?

Si las respuestas no son claras, la próxima inversión no es otro caso de uso, es la base.

  • Aprenda cómo Databricks ayuda a los bancos a unificar datos, gobernanza e IA a escala
  • Explore casos de uso y arquitecturas de banca del mundo real
  • Póngase en contacto con nuestro equipo para hablar sobre su estrategia de plataforma de datos

Descargo de responsabilidad: Asistimos a CBA Live 2026 en San Diego. Las observaciones en esta publicación son nuestras, basadas en las sesiones a las que asistimos y las conversaciones mantenidas durante la conferencia.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Never miss a Databricks post

Subscribe to our blog and get the latest posts delivered to your inbox