Abriendo la base de datos OLTP a otros motores
Mover datos desde su base de datos operativa tradicionalmente significaba configurar y monitorear un pipeline desde cada fuente a cada destino. Para la mayoría de los equipos, esto es un esfuerzo humano frágil, sin gobernar y de orden O(n).
Hoy, estamos cambiando este enfoque. Disponible ahora en Vista Previa Pública, Lakebase presenta un Feed de Cambios de Datos (CDF) que se almacena y se gobierna en Tablas Administradas de Unity Catalog. Habilite el feed una vez y permita que todos los motores, modelos y agentes lean directamente de él.

Si bien Lakeflow Connect ha hecho que la ingesta de datos en el Lakehouse sea trivial, extraer datos de la base de datos OLTP sigue siendo un proceso manual y de alta fricción. Extraer la Captura de Datos de Cambios (CDC) obliga a los equipos a configurar conectores de bases de datos, supervisar los estados de replicación, mitigar los impactos en el rendimiento y rastrear errores a través de herramientas desconectadas. Este modelo se desmorona en el desarrollo basado en agentes que depende de la ramificación rápida de datos. Mantener pipelines de extracción complejos y sin gobernar para cada nueva rama a cada destino no es sostenible.
El Lakehouse eliminó los pipelines de extracción para análisis al almacenar datos una vez en formatos abiertos (Apache Iceberg™, Delta Lake). Estableció el Feed de Cambios de Datos (CDF) como el estándar para la replicación downstream, potenciando flujos de trabajo ETL, de streaming y registros de auditoría.

Ahora puede configurar ese CDF de forma nativa en Lakebase. Habilitarlo toma menos de un minuto y se aplica a todas las tablas dentro de un proyecto. Desde este único feed, puede construir pipelines de streaming con SDP, generar vistas materializadas con DBSQL o computar y almacenar embeddings con Agent Bricks. Cada consumidor downstream se suscribe al mismo feed exacto, completamente aislado de su carga de trabajo operativa principal.
Con Lakebase, sus datos operativos ya no están aislados del Lakehouse. Lakebase ya ofrece Tablas Sincronizadas, estableciendo el patrón de servir datasets Gold directamente a las aplicaciones. Lakebase CDF completa la arquitectura. Su base de datos operativa es ahora su capa Bronze nativa, eliminando la necesidad de pipelines separados o trabajos de extracción para cargar datos en el Lakehouse. En su lugar, obtiene gobernanza y linaje completos en todo el ciclo de vida de los datos a través de Unity Catalog.
Esto es solo el comienzo. Estamos llevando la apertura que ama del Lakehouse directamente a Lakebase. Manténgase atento a la Data and AI Summit y únase a nuestra sesión breakout sobre esta arquitectura.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.