Por décadas, os bancos de dados têm sido a espinha dorsal do software: impulsionando silenciosamente tudo, desde fluxos de checkout de e-commerce até planejamento de recursos empresariais. Cada pedaço de software no mundo, cada aplicativo, cada fluxo de trabalho, cada linha de código gerada por IA, em última análise, depende de um banco de dados subjacente. Ao longo do caminho, reinventamos completamente como os aplicativos são construídos, mas os bancos de dados subjacentes mudaram muito pouco desde os anos 1980. Eles se baseiam em arquiteturas que precedem a nuvem moderna e sofrem com o seguinte:
É hora dos bancos de dados evoluírem.
Novos sistemas estão começando a surgir que abordam as limitações dos bancos de dados tradicionais. Um Lakebase é uma nova arquitetura aberta que combina os melhores elementos de bancos de dados transacionais com a flexibilidade e a economia do data lake. Os Lakebases são habilitados por um design fundamentalmente novo: separando computação de armazenamento e colocando os dados do banco de dados diretamente em armazenamento de baixo custo na nuvem (“lake”) em formatos abertos, enquanto permite que a camada de computação transacional seja executada independentemente por cima.
Essa separação é o avanço principal. Bancos de dados tradicionais agrupam CPU e armazenamento em um sistema monolítico que deve ser provisionado, gerenciado e pago como uma única máquina grande. Lakebase divide essas camadas. Os dados vivem abertamente no lake, enquanto o mecanismo do banco de dados se torna uma camada de computação totalmente gerenciada e sem servidor (por exemplo, Postgres) que pode escalar instantaneamente. Essa arquitetura elimina grande parte do custo, complexidade e bloqueio que definiram os bancos de dados por décadas, e é especialmente poderosa para cargas de trabalho modernas de IA e baseadas em agentes, onde os desenvolvedores querem lançar muitas instâncias, experimentar livremente e pagar apenas pelo que usam.
Um Lakebase tem os seguintes recursos principais:
Armazenamento separado da computação: Os dados são armazenados de forma barata em armazenamentos de objetos na nuvem (“lake”), enquanto a computação é executada de forma independente e elástica. Isso permite escala massiva, alta concorrência e a capacidade de escalar até zero em menos de um segundo (algo não possível em sistemas de banco de dados legados), eliminando a necessidade de manter máquinas de banco de dados caras ociosas.
Armazenamento ilimitado, de baixo custo e durável: Com os dados residindo no lake, o armazenamento se torna essencialmente infinito e dramaticamente mais barato do que os sistemas de banco de dados tradicionais que exigem infraestrutura de capacidade fixa. E seu armazenamento é suportado pela durabilidade do armazenamento de objetos na nuvem (por exemplo, S3), oferecendo 99,999999999% de durabilidade por padrão. Isso é muito superior à configuração tradicional de banco de dados de ter réplicas para redundância de armazenamento (na maioria das vezes atualizadas assincronamente, o que significa que há chance de perda de dados em muitas configurações em caso de falhas duplas).
Computação Postgres elástica e sem servidor: Lakebase fornece Postgres totalmente gerenciado e sem servidor que escala instantaneamente com a demanda e reduz quando ocioso. Os custos se alinham diretamente com o uso, tornando-o ideal para cargas de trabalho intermitentes, ambientes de desenvolvimento e agentes de IA que iniciam instâncias temporárias.
Ramificação, clonagem e recuperação instantâneas: Bancos de dados podem ser ramificados e clonados da maneira que os desenvolvedores ramificam código. Mesmo bancos de dados em escala de petabytes podem ser copiados em segundos, permitindo experimentação rápida, rollbacks seguros e restauração instantânea sem sobrecarga operacional.
Cargas de trabalho transacionais e analíticas unificadas: Lakebase se integra perfeitamente com o Lakehouse, compartilhando a mesma camada de armazenamento para OLTP e OLAP. Isso permite executar análises em tempo real, machine learning e otimização impulsionada por IA diretamente em dados transacionais sem movê-los ou duplicá-los.
Aberto e multicloud por design: Dados armazenados em formatos abertos evitam o bloqueio proprietário e permitem portabilidade real entre AWS, Azure e outros. A flexibilidade multicloud integrada suporta recuperação de desastres, liberdade de longo prazo e melhores economias ao longo do tempo.
Esses são os atributos-chave do Lakebase. Sistemas transacionais de nível empresarial exigem recursos adicionais como segurança, governança, auditoria e alta disponibilidade — mas com um Lakebase, esses recursos só precisam ser implementados e gerenciados uma vez, em uma única fundação aberta. Lakebase representa a próxima evolução dos bancos de dados: sistemas transacionais reconstruídos para a nuvem, para desenvolvedores e para a era da IA.
Para entender por que uma nova era é necessária, é útil observar como a arquitetura de banco de dados evoluiu nos últimos cinquenta anos. Vemos essa evolução em três gerações distintas:

Exemplos: MySQL, Postgres, Oracle clássico
Os sistemas de banco de dados começaram como monolitos absolutos. Na era pré-nuvem, a rede era a parte mais lenta de qualquer sistema. A única maneira de projetar um banco de dados de alto desempenho era vincular firmemente a computação (CPU/RAM) e o armazenamento (disco) dentro de uma única máquina física. Embora isso fizesse sentido para as limitações de hardware dos anos 1980, criou uma gaiola rígida onde os dados ficavam presos em formatos proprietários e escalar significava comprar uma caixa maior.
Exemplos: Aurora, Oracle Exadata
À medida que a infraestrutura de nuvem melhorou, os fornecedores separaram fisicamente o armazenamento da computação, movendo o armazenamento para camadas de backend proprietárias. Esses sistemas foram maravilhas de engenharia que expandiram os limites de throughput. No entanto, eles não foram longe o suficiente. A separação foi puramente uma otimização interna. Como os dados permanecem trancados dentro de um formato proprietário acessível apenas por um único mecanismo, os sistemas Gen 2 sofrem de becos sem saída estruturais:
Achamos que esses sistemas estão em um estado de transição para a terceira geração definitiva.
Um Lakebase leva a arquitetura desacoplada à sua conclusão lógica definitiva. Como a Geração 2, ele separa a computação do armazenamento, mas com uma diferença crítica: tanto a infraestrutura de armazenamento quanto os formatos de dados são completamente abertos.
Construindo sobre essa arquitetura, ele pode resolver os 3 desafios mencionados anteriormente:
De muitas maneiras, um Lakebase é o que você construiria se tivesse que redesenhar bancos de dados OLTP hoje, agora que o armazenamento de objetos barato e confiável e a elasticidade da nuvem estão disponíveis. À medida que as organizações se movem mais rápido ao adotar a nuvem e a IA, esperamos que este modelo se torne uma base padrão para a construção de sistemas transacionais.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
