As aplicações hoje não podem confiar apenas em eventos brutos. Elas precisam de dados curados, contextuais e acionáveis do lakehouse para alimentar personalização, automação e experiências de usuário inteligentes.
Entregar esses dados de forma confiável com baixa latência tem sido um desafio, muitas vezes exigindo pipelines complexos e infraestrutura personalizada.
Lakebase, recentemente anunciado pela Databricks, aborda este problema. Ele combina um banco de dados Postgres de alto desempenho com integração nativa com lakehouse, tornando o ETL reverso simples e confiável.
O Reverse ETL sincroniza dados de alta qualidade de um lakehouse nos sistemas operacionais que alimentam as aplicações. Isso garante que conjuntos de dados confiáveis e insights orientados por IA fluam diretamente para aplicações que alimentam personalização, recomendações, detecção de fraude e tomada de decisões em tempo real.
Sem o ETL Reverso, os insights permanecem no lakehouse e não chegam às aplicações que precisam deles. O lakehouse é onde os dados são limpos, enriquecidos e transformados em análises, mas não é construído para interações de aplicativos de baixa latência ou cargas de trabalho transacionais. É aí que o Lakebase entra, entregando dados confiáveis do lakehouse diretamente nas ferramentas onde eles impulsionam a ação, sem pipelines personalizados.
Na prática, o reverse ETL normalmente envolve quatro componentes-chave, todos integrados ao Lakebase:

O ETL reverso parece simples, mas na prática, a maioria das equipes enfrenta os mesmos desafios:
Esses desafios criam atrito tanto para os desenvolvedores quanto para o negócio, retardando os esforços para ativar os dados de forma confiável e entregar aplicações inteligentes em tempo real.
Lakebase remove essas barreiras e transforma o ETL reverso em um fluxo de trabalho totalmente gerenciado e integrado. Ele combina um motor Postgres de alto desempenho, integração profunda com o lakehouse e sincronização de dados integrada para que insights frescos fluam para as aplicações sem infraestrutura extra.
Essas capacidades do Lakebase são especialmente valiosas para o ETL reverso:
Com essas capacidades na Plataforma de Inteligência de Dados Databricks, o Lakebase substitui a configuração fragmentada de reverse ETL que depende de pipelines personalizados, sistemas OLTP independentes e governança separada. Ele oferece um serviço integrado, de alto desempenho e seguro, garantindo que insights analíticos fluam para as aplicações mais rapidamente, com menos esforço operacional e com a governança preservada.
Como exemplo prático, vamos ver como construir um portal de suporte inteligente alimentado pelo Lakebase. Este portal interativo ajuda as equipes de suporte a triar incidentes recebidos usando insights orientados por ML do lakehouse, como risco de escalada previsto e ações recomendadas, permitindo que os usuários atribuam propriedade, acompanhem o status e deixem comentários em cada ticket.
Lakebase torna isso possível sincronizando previsões no Postgres enquanto também armazena atualizações do aplicativo. O resultado é um portal de suporte que combina análises com operações ao vivo. A mesma abordagem se aplica a muitos outros casos de uso, incluindo motores de personalização e painéis orientados por ML.
Os dados do incidente, enriquecidos com previsões de ML, estão em uma tabela Delta e são atualizados em tempo quase real por meio de um pipeline de streaming. Para alimentar o aplicativo de suporte, usamos o reverse ETL do Lakebase para sincronizar continuamente esta tabela Delta com uma tabela Postgres.
Na interface do usuário, selecionamos:
Isso garante que o aplicativo reflita os dados mais recentes com o mínimo de atraso.
Nota: Você também pode criar o pipeline de sincronização programaticamente usando o SDK Databricks.

O aplicativo de suporte também precisa de uma tabela para armazenar dados inseridos pelo usuário, como propriedade, status e comentários. Como esses dados são escritos a partir do aplicativo, eles devem ir para uma tabela separada no Lakebase (em vez da tabela sincronizada).
Aqui está o esquema:
Este design garante que o reverse ETL permaneça unidirecional (Lakehouse → Lakebase), enquanto ainda permite atualizações interativas através do aplicativo.
Os Apps Databricks suportam integração de primeira classe com o Lakebase. Ao criar seu aplicativo, basta adicionar o Lakebase como um recurso do aplicativo e selecionar a instância e o banco de dados do Lakebase. O Databricks provisiona automaticamente uma função Postgres correspondente para o principal de serviço do aplicativo, simplificando a conectividade do aplicativo ao banco de dados. Você pode então conceder a este papel as permissões necessárias de banco de dados, esquema e tabela.

Com seus dados sincronizados e permissões em vigor, agora você pode implementar o aplicativo Flask que alimenta o portal de suporte. O aplicativo se conecta ao Lakebase via Postgres e serve um painel rico com gráficos, filtros e interatividade.
Trazer insights analíticos para aplicações operacionais não precisa mais ser um processo complexo e frágil. Com o Lakebase, o ETL reverso se torna uma capacidade totalmente gerenciada e integrada. Combina o desempenho de um motor Postgres, a confiabilidade de uma arquitetura escalável e a governança da Plataforma Databricks.
Seja você alimentando um portal de suporte inteligente ou construindo outras experiências orientadas por dados em tempo real, o Lakebase reduz a sobrecarga de engenharia e acelera o caminho do insight para a ação.
Para saber mais sobre como criar tabelas sincronizadas no Lakebase, confira nossa documentação e comece hoje mesmo.
(This blog post has been translated using AI-powered tools) Original Post
Produto
June 11, 2024/11 min de leitura

