데이터 앱 및 AI 에이전트를 위한 완전 관리형 Postgres
작성자: Jasraj Dange, 안드레이 드라구스, Dave Nettleton, 한스 노르하임, 수잔 피어스 , Reynold Xin
Data and AI Summit에서 지능형 애플리케이션 구축을 위한 운영 데이터베이스의 새로운 범주인 lakebase를 소개했습니다. 오늘날 저희는 데이터 앱 및 AI를 위해 구축된 최초의 완전 관리형 Postgres 데이터베이스인 Databricks Lakebase의 공개 미리 보기 버전을 발표하게 되어 기쁩니다.
고객들은 운영 데이터와 분석 데이터를 결합하여 지능형 애플리케이션을 구축하고 있습니다. 즉, 기능 및 모델 제공, 독립형 애플리케이션 구축 또는 lakehouse에서 운영 데이터 분석을 수행하고 있습니다. 하지만 지난 수십 년간 데이터베이스에는 큰 혁신이 없었기 때문에 프로비저닝, 확장 및 현대적인 개발 경험 부족으로 계속 어려움을 겪고 있습니다.
Lakebase는 AI 시대를 위한 솔루션을 제공합니다. 이 블로그에서는 주요 Databricks Lakebase 기능과 이점을 소개하고 고객이 현재 Lakebase를 어떻게 사용하고 있는지 간략하게 설명하겠습니다.
OLTP 데이터베이스는 90년대 이후 근본적으로 변하지 않았습니다. 클라우드에 배포되더라도 이러한 레거시 데이터베이스는 프로비저닝 및 관리가 느리고 비용이 많이 듭니다. 운영 데이터베이스는 일반적으로 분석 플랫폼과 별도의 스택에 배포되어 트랜잭션 데이터와 분석 데이터 간의 사일로를 생성합니다. 또한 이러한 데이터베이스는 AI 개발에 필요한 현대적인 개발 워크플로에 적합하지 않습니다. 기존 아키텍처는 일반적으로 개발, 테스트, 스테이징 및 프로덕션 환경에 대해 별도의 데이터베이스를 포함하며, 각 환경은 별도로 프로비저닝, 채우기 및 유지 관리됩니다.
Databricks Lakebase는 개방형 소스 표준을 기반으로 구축된 최초의 데이터베이스로, 컴퓨팅과 스토리지를 분리한 고도로 확장 가능한 아키텍처를 기반으로 하며 현대적인 애플리케이션 개발을 위해 특별히 설계되었습니다. Lakebase는 lakehouse에 깊이 통합되어 운영, 분석 및 AI 스택을 더 쉽게 결합할 수 있습니다.
지난 7년 동안 Postgres는 개발자 커뮤니티에서 가장 인기 있는 데이터베이스가 되었으며 현대적인 애플리케이션을 위한 사실상의 데이터베이스 선택이 되었습니다. 개방형 소스이며 확장 기능의 활발한 생태계를 갖추고 있으며 라이브러리, 도구 및 프레임워크의 강력한 커뮤니티 지원을 받습니다. 엔지니어는 이미 이를 다루는 방법을 알고 있으며, 모든 기본 모델은 Postgres 생태계에서 사용할 수 있는 방대한 양의 데이터로 학습되므로 지능형 애플리케이션 및 에이전트에 매우 쉽게 액세스할 수 있습니다.

PostGIS 및 pgvector와 같은 인기 있는 확장 기능과 광범위한 드라이버 및 도구 생태계를 지원하는 Lakebase는 개발 팀에게 친숙한 풍부한 기능 세트를 제공합니다.
Lakebase는 컴퓨팅과 스토리지를 분리하는 아키텍처를 활용하여 독립적인 확장을 지원하면서도 낮은 지연 시간(<10ms) 및 높은 동시성 트랜잭션(>10k qps)을 지원합니다.
Lakebase는 Databricks에서 완전히 관리하므로 프로비저닝하거나 유지 관리할 인프라가 없습니다. 그 결과 인프라 및 개발 프로세스의 마찰을 제거하는 데이터베이스 서비스로, 팀은 제어 또는 안정성을 저하시키지 않고 더 빠르게 이동할 수 있습니다.
Lakebase는 복사 후 쓰기 브랜칭 및 자동 확장 서버리스 컴퓨팅을 제공하는 Neon 기술을 기반으로 구축되었습니다. 복사 후 쓰기 브랜칭을 사용하면 기존 데이터베이스와 동일한 데이터 및 스키마를 가진 새 데이터베이스를 원본에 영향을 주지 않고 즉시 생성할 수 있습니다. 이 새 데이터베이스는 기본 데이터를 복제하지 않으므로 경제적입니다. 서버리스 컴퓨팅 자동 확장은 1초 미만의 시작 시간을 제공하며 수요에 따라 확장되며 제로 확장으로 비용 효율적인 컴퓨팅 활용이 가능합니다.
결합된 컴퓨팅의 서버리스 자동 확장 및 브랜칭 기능은 애플리케이션의 개발 패러다임을 완전히 바꿉니다. 개발자는 각 git 브랜치에 맞게 데이터베이스 브랜치를 즉시 생성할 수 있으며 새로운 데이터베이스 인스턴스를 설정하거나 개발 또는 테스트 환경을 위해 데이터를 샘플링하거나 여러 데이터베이스를 채우는 것에 대해 걱정할 필요가 없습니다.
개발자와 에이전트 모두에게 이는 임시 데이터베이스 환경을 거의 비용과 노력 없이 신속하게 생성, 사용 및 폐기할 수 있음을 의미합니다.
Lakebase의 전체 Neon 개발 환경과 더 많은 흥미로운 기능이 곧 제공될 예정입니다.
Lakebase는 트랜잭션 데이터베이스 계층을 lakehouse와 통합하고 Databricks Platform의 운영 성숙도(관찰 가능성, 보안 및 액세스 제어 포함)를 상속합니다. Lakebase는 Unity Catalog 관리 테이블과 동기화되어 사용자 지정 ETL 파이프라인 없이 운영, 분석 및 AI 워크로드를 빠르고 쉽게 결합할 수 있습니다. 결과적으로 lakehouse 내에서 생성된 기능 또는 예측을 소비하고 통합 플랫폼 내에서 신선한 운영 데이터로 분석 계층을 업데이트하는 지능형 애플리케이션을 구축할 수 있습니다.
비공개 미리 보기 프로그램에 수백 명의 고객이 참여하면서 다음과 같은 다양한 사용 사례를 보게 되어 흥미로웠습니다.

Heineken의 목표는 최고의 연결성을 갖춘 양조업체가 되는 것입니다. 이를 위해 모든 데이터 세트를 통합하여 데이터에서 가치 창출까지의 경로를 가속화할 방법이 필요했습니다. Databricks는 오랫동안 분석의 기반이 되어 제품 추천 및 공급망 개선과 같은 인사이트를 만들어 왔습니다. 이제 저희의 분석 데이터 플랫폼은 운영 AI 데이터 플랫폼으로 진화하고 있으며, 이러한 인사이트를 저지연으로 애플리케이션에 제공해야 합니다. — Jelle Van Etten, Heineken 글로벌 데이터 플랫폼 총괄
Tibber에서 고객이 에너지 소비를 제어할 수 있도록 지원하려면 유연한 데이터 인프라가 필요합니다. Lakebase와 Databricks의 통합은 분석 및 트랜잭션 데이터를 쉽게 제공하여 고객에게 실시간 인사이트를 제공하는 데 도움이 됩니다. — Niklas Nordansjö, Tibber AS 데이터 플랫폼 리드
강력한 파트너 네트워크는 Lakebase 고객이 데이터 통합, 비즈니스 인텔리전스 및 거버넌스를 위해 기존 기술 파트너 및 시스템 통합업체와 협력하도록 지원합니다. 저희는 Lakebase를 위한 훌륭한 업계 출시 파트너 그룹을 확보하게 되어 기쁩니다.

dbt Labs에서는 데이터 엔지니어링 방식을 바꾸고 있습니다. Databricks의 새로운 Lakebase를 통해 저희 공동 고객은 이제 저지연 트랜잭션 데이터와 분석 데이터를 Databricks의 단일 플랫폼에서 결합할 수 있게 될 것입니다. 이를 통해 저희는 고객을 위해 엔터프라이즈 규모의 AI를 제공할 수 있습니다. Databricks와 함께 분석의 새로운 시대를 열기를 기대합니다. — Ryan Segar, dbt Labs 최고 제품 책임자
Lakebase는 Postgres의 친숙함과 확장성, 최신 서버리스 아키텍처의 확장성, 최신 개발자 경험을 레이크하우스의 통합 데이터 경험 및 Databricks Data Intelligence Platform의 운영 성숙도와 결합합니다. 이러한 요소를 단일의 완전 관리형 서비스로 결합함으로써 Lakebase는 팀이 트랜잭션 시스템과 관련된 전통적인 운영 복잡성 없이 지능형 데이터 기반 애플리케이션을 구축할 수 있도록 지원합니다.
Lakebase는 Public Preview로 제공되며 가격 정보는 여기에서 확인할 수 있습니다. 분석 및 AI를 통합하는 애플리케이션을 구축하려는 경우, 개발을 가속화하고 운영을 단순화할 준비가 된 스택의 누락된 조각입니다. 워크스페이스 또는 계정 관리자인 경우 Databricks 워크스페이스에서 직접 사용 설정할 수 있습니다. 지금 바로 사용해 보세요!

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.