2026년 4월 27일

주요 기술 기업들이 Lakebase로 빌더 세금을 없애는 방법

AI 네이티브 앱은 운영 데이터와 분석이 함께 있어야 합니다. 팀이 장벽을 제거하는 방법은 다음과 같습니다.

데이터 이동 계층 축소: 선도적인 조직은 Databricks Lakebase를 사용하여 운영 데이터와 분석 데이터를 단일 거버넌스 플랫폼으로 통합하여 ETL 및 역방향 ETL을 제거하고 있습니다.
실시간 인텔리전스 활성화: 앱과 AI 시스템은 동기화 지연 없이 최신 저지연 데이터에서 직접 작동합니다.
AI 시스템 프로덕션화: 통합된 아키텍처는 운영 오버헤드를 줄이고 대규모에서 지속적인 학습 루프를 가능하게 합니다.

AI 앱 로드맵을 망치는 숨겨진 비용

AI 네이티브 앱을 구축하는 선도적인 기술 조직 전반에 걸쳐 주요 제약 조건은 모델 기능에서 기본 데이터 아키텍처, 특히 데이터 파이프라인으로 바뀌었습니다. 에이전트 및 빠른 실험 개발을 위한 낮은 한계 비용을 위해 실시간 상태 컨텍스트에 액세스해야 하는 AI 시스템의 요구 사항은 기존의 분리된 데이터 아키텍처의 치명적인 결함을 드러냈습니다.

운영 워크로드는 일반적으로 클라우드 트랜잭션 데이터베이스(예: 관리형 Postgres/MySQL 엔진)에서 실행되는 반면, 분석, ML 파이프라인 및 기능 엔지니어링은 레이크하우스에 있습니다. 이러한 계층 간의 동기화는 복잡한 CDC 파이프라인, ETL/ELT 작업 및 역방향 ETL 프레임워크의 메쉬에 의존합니다. 이는 다음과 같은 시스템 비효율성을 초래합니다.

데이터 최신성 부족: AI 시스템은 실시간 상태가 아닌 지연된 스냅샷으로 작동합니다.
아키텍처 파편화: 거버넌스, 계보 및 액세스 제어가 시스템 전반에 걸쳐 중복됩니다.
운영 오버헤드: 엔지니어링 노력이 제품 개발에서 파이프라인 오케스트레이션 및 장애 관리로 전환됩니다.

이를 빌더의 세금이라고 부릅니다. 즉, 분리된 운영 및 분석 스택에서 발생하는 구조적 비효율성입니다. 플랫폼, SaaS 제품 및 개발자 도구를 구축하는 기술 회사 내의 사람들에게는 모든 것이 실행되는 이 세금은 특히 해롭습니다. 모든 새로운 AI 기능은 또 다른 데이터베이스, 또 다른 파이프라인, 또 다른 분기 지연을 발생시킵니다.

아키텍처 전환: 앱과 데이터의 공동 배치

이 패턴을 깨기 위해 선도적인 기술 회사들은 단순히 또 다른 전문 도구를 채택하는 것을 넘어 아키텍처를 재설계하고 있습니다. 그들은 분석과 동일한 거버넌스 기반에서 직접 앱과 AI를 실행하는 것을 보고 있습니다.

데이터 이동 비용을 줄이기 위해 RDS와 클라우드 데이터 웨어하우스를 대체하는 솔루션으로 완전 관리형 서버리스 Postgres 엔진인 Databricks Lakebase을 소개합니다.

앱은 레이크하우스 관리 데이터에 직접 읽고 씁니다.
거버넌스는 모든 워크로드에 걸쳐 Unity Catalog를 통해 중앙 집중화됩니다.
자동화된 스냅샷 및 내장된 장애 복구를 통한 안정적인 운영 데이터

이는 앱, AI 및 분석이 동일한 운영 스토어를 공유하는 단일 거버넌스 계층인 상호 운용 가능한 애플리케이션 기반을 구축합니다.

실제 시나리오

Amey Banarse는 PostgresConf 2026에서 “트랜잭션에서 에이전트로: 최신 AI 애플리케이션의 PostgreSQL”을 발표했습니다[슬라이드]. Amey는 Lakebase + AI DevKit에서 완전히 구축된 헬스케어 클레임 앱의 라이브 워크스루를 다루며, 레이크하우스 인텔리전스, 운영 인사이트 및 지속적인 학습 루프가 단일 Databricks 기반에서 어떻게 실행되는지 보여줍니다.

조직은 일반적으로 세 가지 주요 벡터를 통해 이 아키텍처에 진입합니다.

역방향 ETL 파이프라인 제거: 분석 데이터 세트(골드 계층 테이블)는 네이티브 통합을 통해 Lakebase로 직접 동기화됩니다. 이는 외부 도구에 대한 의존성을 제거하고 파이프라인의 취약성을 줄입니다.
AI 네이티브 앱 및 내부 도구: 모델 서빙, 기능 스토어 및 분석을 갖춘 단일 서버리스 스택으로 Databricks 앱 + Lakebase를 실행합니다. 프로비저닝할 추가 인프라가 없습니다.
에이전트 메모리 및 상태: 의미론적 검색을 위한 pgvector가 포함된 Lakebase는 에이전트가 추론하는 데이터와 함께 Agent Bricks로 구축된 에이전트의 운영 메모리 계층이 됩니다.

기술 회사들이 실제로 보고 있는 것

아래 결과는 Lakebase 아키텍처로 전환한 기술 회사들로부터 나온 것입니다.

YipitData는 100만 건의 레코드를 시간당 처리하도록 AI 에이전트 파이프라인을 확장하여 92-95%의 태깅 정확도와 20배의 회사 범위를 달성했습니다. Unity Catalog 내에서 Lakebase를 관계형 레코드 시스템으로 사용하여 에이전트는 깨지기 쉬운 외부 스토어나 동기화 지연 없이 내구성 있고 거버넌스된 상태로 작동합니다.

Quantum Capital Group은 6개의 분산된 데이터 소스에 걸쳐 15억 개 이상의 레코드를 관리했습니다. Lakebase로 통합한 후 100개 이상의 중복 테이블을 제거하고 데이터 엔지니어링 시간을 50% 단축했으며 보고 속도를 3배로 늘렸습니다. 팀은 이제 버전 스프롤과 싸우는 대신 단일 신뢰할 수 있는 데이터 세트에서 작업합니다.

Ensemble Health Partners는 15개 이상의 분산된 SQL Server 시스템을 통합했습니다. Lakebase를 트랜잭션 계층으로 사용하여 운영 효율성을 20% 개선하고 고객이 연간 순수익을 3-5% 더 많이 확보하도록 도운 AI 기반 수익 주기 워크플로를 배포했습니다.

Replit은 수백만 명의 개발자가 소프트웨어를 구축하고 배포하는 플랫폼을 지원하며, Lakebase + Databricks AI DevKit를 사용하여 고객이 3주 만에 프로덕션 코드 생성 AI를 출시하고 개발자 속도를 10배 높여 처음부터 운영 및 분석 시스템 간의 격차를 해소하도록 돕습니다.

IntentHQ는 소비자 인텔리전스 플랫폼으로, Lakebase에 서빙 계층을 중앙 집중화하여 실시간 개인화 기능을 대규모로 지원합니다. 이를 통해 AI 모델은 사용자 지정 파이프라인 없이 레이크하우스 데이터와 동기화되는 저지연 운영 스토어를 확보할 수 있습니다.

결과 이면의 아키텍처 패턴

AI 에이전트 및 개인화 엔진부터 의료 워크플로 및 개발자 플랫폼에 이르기까지 사용 사례가 다르지만, 이러한 조직은 고립된 최적화를 통해 성공하는 것이 아닙니다. 그들은 근본적으로 다른 아키텍처 모델로 수렴하고 있습니다.
핵심적으로 이 아키텍처 모델은 트랜잭션 시스템, 분석 플랫폼 및 AI 파이프라인 간의 기존 분리를 제거하고 공유 가능한 상호 운용 가능한 데이터 기반으로 대체합니다.
이 패턴은 일관되게 세 가지 긴밀하게 통합된 계층을 포함합니다.

레이크하우스 인텔리전스 계층
배치 및 스트리밍 데이터, 기능 엔지니어링 및 AI/ML 워크로드가 작동하는 거버넌스되고 확장 가능한 기반입니다. 이 계층은 통합 데이터에 대한 대규모 처리, 모델 학습 및 분석을 가능하게 하는 인사이트 시스템을 제공합니다.
운영 데이터 계층
애플리케이션 및 에이전트의 실행 시스템 역할을 하는 저지연 트랜잭션 인터페이스(Lakebase)입니다. 이 계층은 복제 또는 동기화 오버헤드 없이 거버넌스된 데이터에 대한 실시간 읽기/쓰기, 상태 관리 및 애플리케이션 로직을 가능하게 합니다.
지속적인 학습 루프
애플리케이션 상호 작용, 에이전트 출력 및 사용자 신호가 캡처되어 모델 파이프라인에 다시 통합되는 폐쇄 루프 피드백 시스템입니다. 이는 AI 기능이 실제 사용 사례를 기반으로 발전할 수 있도록 하는 지속적인 개선 시스템을 구축합니다.

이 세 계층이 기반을 공유할 때 AI 시스템은 격리된 워크로드에서 지속적으로 개선되는 프로덕션 시스템으로 전환됩니다.

빌더의 세금 제거

빌더의 세금은 피할 수 없습니다. 이는 다른 시대에 설계된 인프라 위에 AI를 구축한 결과입니다. 즉, 데이터베이스는 모놀리식이었고, 앱은 상태 비저장(stateless)이었으며, 인텔리전스는 별도의 프로젝트였습니다.

Lakebase는 수학을 바꿉니다! 앱은 데이터가 있는 곳에서 실행됩니다. 에이전트는 필요한 컨텍스트를 갖게 됩니다. 그리고 파이프라인에 팀이 쏟았던 엔지니어링 시간은 다시 제품 출시에 사용될 수 있습니다.

Amey Banarse의 PostgresConf 2026 세션 “거래에서 에이전트로: 최신 AI 애플리케이션의 PostgreSQL” [슬라이드] 를 시청하여 Lakebase에서 구축된 완전한 AI 네이티브 앱을 직접 확인해 보세요.

Databricks Lakebase는 에이전트와 앱을 위해 구축된 서버리스 Postgres입니다. databricks.com/product/lakebase에서 자세히 알아보세요.

Q: Databricks Lakebase란 무엇인가요?

A: Databricks Lakebase는 데이터 앱과 AI 에이전트를 위해 구축된 완전 관리형 서버리스 Postgres OLTP 데이터베이스입니다. Databricks Platform에 네이티브로 통합되어 있어 앱과 AI가 레이크하우스 데이터에 직접 읽고 쓸 수 있으며, Unity Catalog를 통해 트랜잭션 워크로드와 분석 워크로드 전반의 거버넌스를 단일 계층에서 중앙화합니다. 기존에는 운영 데이터베이스와 분석 플랫폼을 별도로 유지하며 CDC/ETL 파이프라인으로 동기화해야 했지만, Lakebase는 이 이중 스택을 하나의 아키텍처로 통합해 데이터 최신성 부족, 파이프라인 운영 오버헤드, 거버넌스 파편화 문제를 해결합니다. pgvector를 통한 벡터 검색, Scale to Zero 서버리스 가격 책정, 자동화된 스냅샷 및 장애 복구를 기본으로 제공하며, AI 에이전트의 메모리/상태 저장소부터 멀티테넌트 SaaS 앱, 실시간 개인화 엔진까지 다양한 엔터프라이즈 워크로드를 지원합니다.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)