Descripciones del producto:
Banco Bradesco cuenta con 80 años de experiencia en servicios financieros y es uno de los bancos más grandes de América Latina, con más de 75 millones de clientes en siete países. En la banca digital, poder responder rápidamente a las interacciones con los clientes es fundamental para el éxito. Sin embargo, los sistemas tecnológicos antiguos del Banco Bradesco dificultaban y encarecían la recopilación y el análisis de los datos de los clientes procedentes de los canales digitales y de marketing, y las herramientas fragmentadas a menudo generaban datos poco fiables. Utilizando Databricks y Spark Declarative Pipelines, Banco Bradesco creó una nueva plataforma de datos de clientes (CDP) interna que cambió la forma en que entienden y atienden a sus clientes.
Una orientación centrada en el cliente
El cambio de Banco Bradesco hacia una estrategia más centrada en el cliente colocó su sistema de gestión de relaciones con el cliente (CRM) en el centro de su infraestructura tecnológica. La CRM desempeña un papel fundamental en las operaciones del banco: en el caso de su producto principal, el crédito, el sistema de CRM influyó en al menos el 30 % de todas las transacciones en 2024. Al brindar soporte a los clientes a través de múltiples canales, desde sucursales bancarias tradicionales hasta plataformas digitales, el sistema de CRM gestiona las comunicaciones a través de 14 canales principales y fue responsable de 7,7 mil millones de comunicaciones solo en 2024.
El enfoque centrado en el cliente del banco genera cantidades masivas de datos. Banco Bradesco procesa un promedio de 2,9 mil millones de observaciones sin procesar por mes provenientes de varias fuentes, incluidas aplicaciones móviles, notificaciones push y comunicaciones por correo electrónico, además de 2.5 mil millones de observaciones sin procesar adicionales provenientes de etiquetas. La gestión de este enorme volumen de datos recaía en un equipo reducido de solo nueve personas que supervisaban 22 conjuntos de datos diferentes.
Los sistemas antiguos en las instalaciones de Banco Bradesco creaban importantes cuellos de botella. El banco solía experimentar retrasos de tres días en la obtención de datos de su CRM, lo que hacía casi imposible responder rápidamente a las necesidades de los clientes. "Necesitábamos una vista consolidada de la información del cliente", dice Marcos Abrantes Gomes, gerente sénior de Banco Bradesco. "Por ejemplo, podíamos ver que el 10 % de los clientes interactuaban con una campaña, pero necesitábamos análisis oportunos para determinar las mejores ofertas para esos clientes".
Las limitaciones técnicas resultaron frustrantes. La extracción de datos se limitaba a un archivo por vez por canal en los 14 canales, y el largo tiempo de procesamiento en el origen generaba aún más retrasos. Sin información actualizada sobre las interacciones de los clientes y el rendimiento de las campañas, Banco Bradesco tenía dificultades para ofrecer las experiencias personalizadas que esperaban sus clientes.
Construyendo una plataforma de datos moderna
Para abordar esos desafíos, recurrió a Databricks e implementó Spark Declarative Pipelines como base para su nueva CDP. El banco utilizó primero Databricks para ingerir datos sin procesar casi en tiempo real y crear tablas para su equipo de analistas, lo que garantizó la calidad de la información. Crearon una capa de ingestión de preprocesamiento para validar la integridad de los archivos y solicitar automáticamente el reemplazo de las entradas dañadas.
La solución aprovecha la arquitectura lakehouse de medallón, ingiriendo datos brutos a través de la capa de bronce, limpiándola y validándola en la capa de plata y aplicando modelado dimensional y agregación en la capa de oro. Spark Declarative Pipelines define y ejecuta la lógica completa de la canalización. "Tenemos 14 canales con diferentes fuentes de datos, y Spark Declarative Pipelines es responsable de todas las ejecuciones de procesos que se hacen en paralelo con un clúster", explica Marcos. "Esto nos permite controlar costos, lo cual es muy bueno para nosotros".
La validación de datos garantiza que solo los datos limpios avancen por la canalización, lo que elimina la necesidad de reprocesarlos, algo que afectaba al sistema local del banco. En lugar de reprocesar conjuntos de datos completos, el nuevo sistema realiza actualizaciones incrementales únicamente con los datos nuevos. Desde octubre de 2023, el banco ha procesado 110 000 millones de observaciones sin procesar, lo que equivale esencialmente a 200 millones de nuevos datos al día. Tras implementar Spark Declarative Pipelines, su capa de oro contiene 7 mil millones de filas de datos, recibe 20 millones de filas nuevas y actualiza 15 millones diariamente, además de 40 mil millones de eventos con 60 millones de etiquetas relevantes procesadas cada día.
Las mejoras en el rendimiento han sido espectaculares. El banco redujo la latencia de datos en más del 94 % en comparación con su proceso local, ya que Spark Declarative Pipelines completa todos los procesos en solo 3,5 horas, frente a las 60 a 80 horas anteriores. Sus procesos principales ahora se ejecutan en 3 a 40 minutos, frente a las 3 a 8 horas que tardaban anteriormente. Quizá lo más importante es que el nuevo sistema requiere solo 2 personas para operar, frente a las 8 a 15 necesarias para el proceso anterior en las instalaciones, lo que le permite al banco reasignar a ese personal a tareas más estratégicas.
Transformación de la interacción con el cliente a través de los datos
Con su nueva CDP interna impulsada por Databricks Data Intelligence Platform, Banco Bradesco ha transformado su estrategia de datos en torno a la información de los clientes. Gracias al uso de Spark Declarative Pipelines, el banco logró mejoras significativas en la integridad de los datos, redujo la latencia y el tiempo de procesamiento, y mejoró la productividad y la agilidad empresarial. Lo que antes requería meses de reprocesamiento, semanas de trabajo humano y engorrosas integraciones de datos, ahora se ha simplificado drásticamente, lo que ha supuesto un aumento sustancial de la eficiencia operativa.
Más allá de las mejoras operativas, la plataforma le proporciona al banco una estructura sólida para la interacción con los clientes. Ahora captura y analiza los resultados de las interacciones de los clientes para proporcionar información a sus modelos, lo que permite al banco ofrecer a los clientes el mejor paso siguiente y medir con precisión la eficacia de sus campañas de marketing. Este sistema de circuito cerrado crea un ciclo continuo de mejora en la orientación al cliente y la personalización. "La integración de Spark Declarative Pipelines nos permite confiar en nuestros datos y crear ofertas más contextuales para los clientes", dice Marcos. "Todos los puntos de contacto que tienen los clientes en su recorrido, ya sean espontáneos o provocados por una campaña de marketing, se analizan y transforman en nuevas acciones contextuales".
El impacto en el negocio ha sido significativo. Al transformar la forma en que recopilan, procesan y actúan sobre los datos de los clientes, Banco Bradesco ha convertido sus datos en un activo estratégico, lo que permite ofrecer experiencias bancarias personalizadas a gran escala y duplicar la conversión de las ofertas contextuales.
