No Data and AI Summit, introduzimos uma nova categoria de bancos de dados operacionais chamada lakebases para construção de aplicações inteligentes. Hoje, estamos animados para anunciar a Prévia Pública do Databricks Lakebase, o primeiro banco de dados Postgres totalmente gerenciado para aplicativos de dados e IA.
Os clientes estão combinando seus dados operacionais e analíticos para construir aplicações inteligentes: servindo recursos e modelos, construindo aplicações independentes ou analisando dados operacionais em uma casa de dados. Mas eles continuam a lutar com provisionamento, escalabilidade e a falta de uma experiência moderna de desenvolvimento para dados, porque as bases de dados não têm visto muita inovação nas últimas décadas.
Lakebases fornecem uma solução para a era da IA. Neste blog, apresentaremos as principais características e benefícios do Databricks Lakebase, e delinearemos como os clientes já usam o Lakebase hoje.
Bancos de dados OLTP não mudaram fundamentalmente desde os anos 90. Mesmo quando implantados na nuvem, esses bancos de dados legados são lentos e caros para provisionar e gerenciar. Bancos de dados operacionais são normalmente implantados em uma pilha separada da plataforma de análise, criando silos entre dados transacionais e analíticos. Além disso, esses bancos de dados também não se encaixam em um fluxo de trabalho de desenvolvimento moderno necessário para o desenvolvimento de IA. A arquitetura tradicional geralmente envolve bancos de dados separados para ambientes de desenvolvimento, teste, preparação e produção - cada um provisionado, preenchido e mantido separadamente.
Databricks Lakebase é uma base de dados inédita, construída com base em padrões de código aberto, com uma arquitetura altamente escalável, baseada na separação de computação e armazenamento, especificamente projetada para o desenvolvimento moderno de aplicações. Lakebase está profundamente integrado ao lakehouse para facilitar a combinação de pilhas operacionais, analíticas e de IA.
Nos últimos 7 anos, o Postgres tornou-se a base de dados mais popular na comunidade de desenvolvedores e é a escolha de facto para aplicações modernas. É de código aberto, possui um ecossistema vibrante de extensões e é suportado por uma robusta comunidade de bibliotecas, ferramentas e frameworks. Os engenheiros já sabem como trabalhar com ele, e todos os modelos fundamentais são treinados em grandes quantidades de dados disponíveis para o ecossistema Postgres, tornando-o muito acessível para aplicações inteligentes e agentes.
Com suporte para extensões populares como PostGIS e pgvector, e um amplo ecossistema de drivers e ferramentas, o Lakebase oferece um rico conjunto de capacidades que serão familiares às equipes de desenvolvimento.
Lakebase aproveita uma arquitetura que separa computação e armazenamento, o que permite escalonamento independente enquanto suporta transações de baixa latência (<10ms) e alta concorrência (>10k qps).
O Lakebase é totalmente gerenciado pela Databricks, o que significa que não há infraestrutura para provisionar ou manter. O resultado é um serviço de banco de dados que remove atritos tanto da infraestrutura quanto dos processos de desenvolvimento, permitindo que as equipes avancem mais rápido sem comprometer o controle ou a confiabilidade.
O Lakebase é construído com a tecnologia Neon, que fornece ramificação de cópia na gravação e computação sem servidor com autoescala. A ramificação de cópia na gravação torna possível criar instantaneamente um novo banco de dados com os mesmos dados e esquema de um banco de dados existente, sem afetar o original. Este novo banco de dados é economicamente amigável porque não duplica os dados subjacentes. A computação sem servidor com autoescala proporciona tempos de início inferiores a um segundo e escala com base na demanda, com a escala para zero permitindo uma utilização de computação custo-efetiva.
Juntos, o autoescalamento sem servidor de computação e as capacidades de ramificação mudam completamente o paradigma de desenvolvimento para aplicações. Desenvolvedores podem criar instantaneamente um ramo de banco de dados para corresponder a cada ramo git e não precisam se preocupar em configurar novas instâncias de banco de dados, amostragem de dados para ambientes de desenvolvimento ou teste, ou hidratar vários bancos de dados.
Para desenvolvedores e agentes, isso significa que ambientes de banco de dados efêmeros podem ser rapidamente criados, usados e descomissionados praticamente sem custo, com praticamente nenhum esforço.
A experiência completa do desenvolvedor Neon no Lakebase e muitos outros recursos emocionantes estarão disponíveis em breve.
Lakebase integra uma camada de banco de dados transacional com o lakehouse e herda a maturidade operacional da Plataforma Databricks, incluindo observabilidade, segurança e controles de acesso. Lakebase sincroniza com as tabelas gerenciadas do Catálogo Unity, tornando rápido e fácil combinar cargas de trabalho operacionais, analíticas e de IA sem pipelines ETL personalizados. Como resultado, você pode construir aplicações inteligentes que consomem recursos ou previsões geradas no lakehouse e atualizam a camada analítica com dados operacionais frescos, tudo dentro de uma plataforma unificada.
Com centenas de clientes no programa de Pré-visualização Privada, tem sido emocionante ver a variedade de casos de uso, incluindo:
Na Heineken, nosso objetivo é nos tornar a cervejaria mais bem conectada. Para fazer isso, precisávamos de uma maneira de unificar todos os nossos conjuntos de dados para acelerar o caminho dos dados para o valor. Databricks tem sido há muito tempo nossa base para análises, criando insights como recomendações de produtos e melhorias na cadeia de suprimentos. Nossa plataforma de dados analíticos está agora evoluindo para ser uma plataforma de dados operacionais de IA e precisa entregar esses insights para aplicações com baixa latência.—Jelle Van Etten, Chefe da Plataforma Global de Dados, Heineken
Na Tibber, capacitar os clientes a assumir o controle de seu consumo de energia requer uma infraestrutura de dados flexível. A integração do Lakebase com o Databricks facilita o fornecimento de dados analíticos e transacionais, ajudando-nos a fornecer insights em tempo real para nossos clientes.— Niklas Nordansjö, Líder da Plataforma de Dados, Tibber AS
Uma forte rede de parceiros ajuda os clientes do Lakebase a trabalhar com seus parceiros tecnológicos existentes e Integradores de Sistemas para integração de dados, inteligência de negócios e governança. Estamos animados em ter um incrível grupo de parceiros de lançamento da indústria para o Lakebase.
Na dbt Labs, estamos mudando a forma como a engenharia de dados é feita. Com o novo Lakebase da Databricks, nossos clientes conjuntos agora poderão combinar dados transacionais de baixa latência e dados analíticos em uma única plataforma na Databricks. Isso nos ajudará a fornecer IA em escala empresarial para nossos clientes. Mal podemos esperar para inaugurar a nova era da análise com a Databricks.— Ryan Segar, Diretor de Produto, dbt Labs
Lakebase combina a familiaridade e extensibilidade do Postgres, a escalabilidade de uma arquitetura serverless moderna, uma experiência moderna para desenvolvedores, com a experiência unificada de dados do lakehouse e a maturidade operacional da Plataforma de Inteligência de Dados Databricks. Ao combinar esses elementos em uma única oferta totalmente gerenciada, o Lakebase permite que as equipes construam aplicações inteligentes e orientadas a dados sem a complexidade operacional tradicionalmente associada a sistemas transacionais.
O Lakebase está disponível na Prévia Pública com preços disponíveis aqui. Se você está procurando construir aplicações que incorporam análises e IA, é a peça que faltava em sua pilha, pronta para acelerar o desenvolvimento e simplificar as operações. Se você é um administrador de Workspace ou Conta, você pode ativá-lo diretamente a partir de sua Conta Databricks. Experimente hoje!
(This blog post has been translated using AI-powered tools) Original Post