작성자: Ali Ghodsi, Stas Kelvich, 헤이키 린나칸가스, 니키타 샴구노프, Arsalan Tavakoli-Shiraji, Patrick Wendell, Reynold Xin , Matei Zaharia
수십 년 동안 데이터베이스는 전자상거래 결제 흐름부터 전사적 자원 관리까지 모든 것을 조용히 지원하며 소프트웨어의 중추 역할을 해왔습니다. 세상의 모든 소프트웨어, 모든 애플리케이션, 모든 워크플로우, 모든 AI 생성 코드 줄은 궁극적으로 데이터베이스에 의존합니다. 그 과정에서 애플리케이션 구축 방식을 완전히 재창조했지만, 기반이 되는 데이터베이스는 1980년대 이후 거의 변하지 않았습니다. 이러한 데이터베이스는 현대 클라우드 이전의 아키텍처에 기반하고 있으며 다음과 같은 문제점을 안고 있습니다.
이제 데이터베이스도 진화할 때입니다.
기존 데이터베이스의 한계를 해결하는 새로운 시스템이 등장하고 있습니다. Lakebase는 트랜잭션 데이터베이스의 장점과 데이터 레이크의 유연성 및 경제성을 결합한 새로운 개방형 아키텍처입니다. Lakebase는 컴퓨팅과 스토리지를 분리하고 데이터베이스 데이터를 저렴한 클라우드 스토리지(“레이크”)에 개방형 형식으로 직접 저장하며, 트랜잭션 컴퓨팅 계층이 그 위에 독립적으로 실행되도록 하는 근본적으로 새로운 설계를 통해 가능해집니다.
이 분리가 핵심적인 돌파구입니다. 기존 데이터베이스는 CPU와 스토리지를 하나의 일체형 시 스템으로 묶어 단일 대형 머신으로 프로비저닝, 관리 및 비용을 지불해야 했습니다. Lakebase는 이러한 계층을 분리합니다. 데이터는 레이크에 개방적으로 저장되고, 데이터베이스 엔진은 즉시 확장할 수 있는 완전 관리형 서버리스 컴퓨팅 계층(예: Postgres)이 됩니다. 이 아키텍처는 수십 년 동안 데이터베이스를 정의해 온 비용, 복잡성 및 종속성을 크게 제거하며, 개발자가 여러 인스턴스를 시작하고 자유롭게 실험하며 사용한 만큼만 비용을 지불하려는 현대 AI 및 에이전트 기반 워크로드에 특히 강력합니다.
Lakebase는 다음과 같은 주요 기능을 갖습니다.
스토리지와 컴퓨팅 분리: 데이터는 클라우드 객체 스토리지(“레이크”)에 저렴하게 저장되고, 컴퓨팅은 독립적이고 탄력적으로 실행됩니다. 이를 통해 대규모 확장성, 높은 동시성 및 1초 이내에 제로까지 확장할 수 있는 기능(레거시 데이터베이스 시스템에서는 불가능)을 제공하여 비싼 데이터베이스 머신을 유휴 상태로 유지할 필요가 없습니다.
무제한의 저렴하고 내구성 있는 스토리지: 데이터가 레이크에 저장되므로 스토리지는 사실상 무한해지고 고정 용량 인프라가 필요한 기존 데이터베이스 시스템보다 훨씬 저렴해집니다. 또한 클라우드 객체 스토리지(예: S3)의 내구성을 기반으로 하며 기본적으로 99.999999999%의 내구성을 제공합니다. 이는 스토리지 중복성을 위해 복제본을 사용하는 기존 데이터베이스 설정(대부분 비동기적으로 업데이트되므로 이중 장애 발생 시 데이터 손실 가능성이 있음)보다 훨씬 뛰어납니다.
탄력적이고 서버리스인 Postgres 컴퓨팅: Lakebase는 수요에 따라 즉시 확장되고 유휴 상태일 때는 축소되는 완전 관리형 서버리스 Postgres를 제공합니다. 비용은 사용량과 직접적으로 일치하므로 버스트 워크로드, 개발 환경 및 임시 인스턴스를 시작하는 AI 에이전트에 이상적입니다.
즉각적인 브랜칭, 복제 및 복구: 데이터베이스를 개발자가 코드를 브랜칭하는 방식과 동일한 방식으로 브랜칭하고 복제할 수 있습니다. 페타바이트 규모의 데이터베이스도 몇 초 안에 복사할 수 있어 빠른 실험, 안전한 롤백 및 운영 오버헤드 없이 즉각적인 복원이 가능합니다.
통합된 트랜잭션 및 분석 워크로드: Lakebase는 OLTP 및 OLAP에 대해 동일한 스토리지 계층을 공유하는 Lakehouse와 원활하게 통합됩니다. 이를 통해 데이터를 이동하거나 복제하지 않고도 트랜잭션 데이터에서 직접 실시간 분석, 머신 러닝 및 AI 기반 최적화를 실행할 수 있습니다.
개방형 및 멀티 클라우드 설계: 개방형 형식으로 저장된 데이터는 독점적인 종속성을 피하고 AWS, Azure 등 전반에 걸쳐 진정한 이식성을 제공합니다. 내장된 멀티 클라우드 유연성은 재해 복구, 장기적인 자유 및 시간이 지남에 따라 더 나은 경제성을 지원합니다.
이것이 Lakebase의 핵심 속성입니다. 엔터프라이즈급 트랜잭션 시스템에는 보안, 거버넌스, 감사 및 고가용성과 같은 추가 기능이 필요하지만, Lakebase를 사용하면 이러한 기능은 단일 개방형 기반에서 한 번만 구현하고 관리하면 됩니다. Lakebase는 데이터베이스의 다음 진화 단계로, 클라우드, 개발자 및 AI 시대를 위해 재구축된 트랜잭션 시스템입니다.
새로운 시대가 필요한 이유를 이해하려면 지난 50년간 데이터베이스 아키텍처가 어떻게 진화했는지 살펴보는 것이 도움이 됩니다. 우리는 이 진화를 세 가지 뚜렷한 세대로 보고 있습니다.

예시: MySQL, Postgres, 클래식 Oracle
데이터베이스 시스템은 절대적인 모놀리스로 시작되었습니다. 클라우드 이전 시대에는 네트워크가 시스템에서 가장 느린 부분이었습니다. 고성능 데이터베이스를 설계하는 유일한 방법은 컴퓨팅(CPU/RAM)과 스토리지(디스크)를 단일 물리적 머신 내에 긴밀하게 결합하는 것이었습니다. 이는 1980년대 하드웨어 제약에는 합리적이었지만, 데이터가 독점 형식에 갇히고 확장이 더 큰 상자를 구매하는 것을 의미하는 경리적인 우리를 만들었습니다.
예시: Aurora, Oracle Exadata
클라우드 인프라가 개선되면서 공급업체는 스토리지를 컴퓨팅과 물리적으로 분리하고 스토리지를 독점 백엔드 계층으로 옮겼습니다. 이러한 시스템은 처리량의 한계를 뛰어넘는 엔지니어링의 경이로움이었습니다. 그러나 그들은 충분히 나아가지 못했습니다. 분리는 순전히 내부 최적화였습니다. 데이터는 단일 엔진만 액세스할 수 있는 독점 형식 내에 잠겨 있기 때문에 2세대 시스템은 구조적 교착 상태를 겪습니다.
우리는 이러한 시스템이 궁극적인 3세대 시스템으로 가는 과도기 상태에 있다고 생각합니다.
Lakebase는 분리된 아키텍처를 궁극적이고 논리적인 결론으로 이끌어갑니다. 2세대와 마찬가지로 컴퓨팅과 스토리지를 분리하지만 중요한 차이점이 있습니다. 바로 스토리지 인프라와 데이터 형식 모두 완전히 개방적이라는 것입니다.
이 아키텍처를 기반으로 구축하면 앞서 언급한 세 가지 문제를 해결할 수 있습니다.
저렴하고 안정적인 객체 저장소와 클라우드 탄력성을 사용할 수 있게 된 오늘날 OLTP 데이터베이스를 재설계해야 한다면 구축할 것이 바로 Lakebase입니다. 조직이 클라우드와 AI를 채택하여 더 빠르게 발전함에 따라 이 모델이 트랜잭션 시스템 구축을 위한 표준 기반이 될 것으로 예상합니다.
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.