Abrindo o banco de dados OLTP para outros motores
Mover dados do seu banco de dados operacional tradicionalmente significava configurar e monitorar um pipeline para cada origem e cada destino. Para a maioria das equipes, isso representa um esforço humano frágil, não governado e com complexidade O(n).
Hoje, estamos mudando essa abordagem. Disponível agora em Public Preview, Lakebase apresenta um Change Data Feed (CDF) que é armazenado e governado em Tabelas Gerenciadas do Unity Catalog. Ative o feed uma vez e permita que todos os motores, modelos e agentes leiam diretamente dele.

Embora o Lakeflow Connect tenha tornado a ingestão de dados no Lakehouse trivial, extrair dados do banco de dados OLTP continua sendo um processo manual e de alto atrito. Extrair a Captura de Dados de Alteração (CDC) força as equipes a configurar conectores de banco de dados, supervisionar estados de replicação, mitigar impactos de desempenho e rastrear erros por meio de ferramentas desconectadas. Esse modelo falha no desenvolvimento baseado em agentes que depende de ramificação rápida de dados. Manter pipelines de extração complexos e não governados para cada nova ramificação e cada destino é insustentável.
O Lakehouse eliminou os pipelines de extração para análise, armazenando os dados uma vez em formatos abertos (Apache Iceberg™, Delta Lake). Ele estabeleceu o Change Data Feed (CDF) como o padrão para replicação downstream, alimentando fluxos de trabalho de ETL, streaming e logs de auditoria.

Agora você pode configurar esse CDF nativamente no Lakebase. Leva menos de um minuto para ativar, aplicando-se a todas as tabelas dentro de um projeto. A partir deste feed único, você pode construir pipelines de streaming com SDP, gerar visualizações materializadas com DBSQL ou computar e armazenar embeddings com Agent Bricks. Cada consumidor downstream assina o mesmo feed exato, completamente isolado da sua carga de trabalho operacional primária.
Com o Lakebase, seus dados operacionais não estão mais isolados do Lakehouse. O Lakebase já oferece Synced Tables, estabelecendo o padrão de servir datasets Gold diretamente para aplicações. O Lakebase CDF completa a arquitetura. Seu banco de dados operacional agora é sua camada Bronze nativa, eliminando a necessidade de pipelines separados ou trabalhos de extração para carregar dados no Lakehouse. Em vez disso, você obtém governança e linhagem completas em todo o ciclo de vida dos dados por meio do Unity Catalog.
Este é apenas o começo. Estamos trazendo a abertura que você ama do Lakehouse diretamente para o Lakebase. Fique ligado para o Data and AI Summit e participe da nossa sessão especial sobre esta arquitetura.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.