오늘날의 애플리케이션들은 단순한 이벤트만으로는 충분하지 않습니다. 그들은 호수집(lakehouse)에서 추출된 정제되고, 맥락이 부여되며, 실행 가능한 데이터가 필요합니다. 이를 통해 개인화, 자동화, 그리고 지능적인 사용자 경험을 제공합니다.
그 데이터를 신뢰성 있게, 낮은 지연 시간으로 전달하는 것은 종종 복잡한 파이프라인과 맞춤형 인프라를 필요로 하는 도전이었습니 다.
Databricks가 최근 발표한 Lakebase는 이 문제를 해결합니다. 이는 고성능 Postgres 데이터베이스와 기본 레이크하우스 통합을 결합하여 역방향 ETL을 간단하고 신뢰할 수 있게 만듭니다.
역방향 ETL은 레이크하우스에서 고품질 데이터를 애플리케이션을 구동하는 운영 시스템으로 동기화합니다. 이를 통해 신뢰할 수 있는 데이터셋과 AI 기반 인사이트가 개인화, 추천, 사기 탐지, 실시간 의사결정을 지원하는 애플리케이션에 직접 흘러들어갑니다.
역방향 ETL이 없다면, 인사이트는 호수집에 머무르게 되고 필요한 애플리케이션에 도달하지 못합니다. 레이크하우스는 데이터가 정제되고, 풍부해지며, 분석으로 변환되는 곳이지만, 저지연 앱 상호작용이나 트랜잭션 작업부하에는 적합하지 않습니다. 여기서 Lakebase가 등장하여, 맞춤형 파이프라인 없이 신뢰할 수 있는 레이크하우스 데이터를 직접 도구로 전달하여 행동을 촉진합니다.
실제로, 역방향 ETL은 일반적으로 Lakebase에 통합된 네 가지 주요 구성 요소를 포함합니다:

역방향 ETL은 간단해 보이지만 실제로, 대부분의 팀은 같은 도전에 직면합니다:
이러한 도전 과제들은 개발자와 비즈니스 모두에게 마찰을 일으키며, 데이터를 신뢰성 있게 활성화하고 지능적인 실시간 응용 프로그램을 제공하는 노력을 늦춥니다.
Lakebase는 이러한 장벽을 제거하고 역방향 ETL을 완전히 관리되는, 통합된 워크플로우로 변환합니다. 높은 성능의 Postgres 엔진, 깊은 레이크하우스 통합, 그리고 내장된 데이터 동기화를 결합하여 신선한 인사이트가 추가 인프라 없이 애플리케이션으로 흘러들어갑니다.
이러한 Lakebase의 기능들은 특히 역방향 ETL에 대해 매우 유용합니다:
이러한 기능들이 Databricks Data Intelligence Platform에 포함되어 있어, Lakebase는 맞춤형 파이프라인, 독립적인 OLTP 시스템, 별도의 거버넌스에 의존하는 분산된 역방향 ETL 설정을 대체합니다. 이는 통합된, 고성능, 보안 서비스를 제공하여, 분석적 통찰력이 더 빠르게, 더 적은 운영 노력으로, 거버넌스가 보존된 상태에서 응용 프로그램으로 흐르도록 보장합니다.
실용적인 예로, Lakebase를 이용한 지능형 지원 포털을 구축하는 방법을 살펴보겠습니다. 이 인터랙티브 포털은 레이크하우스에서 ML을 이용한 인사이트, 예를 들어 예측된 에스컬레이션 위험과 권장 조치 등을 사용하여 지원 팀이 들어오는 사건을 분류하는 데 도움을 주며, 사용자가 각 티켓에 대한 소유권을 할당하고, 상태를 추적하고, 코멘트를 남길 수 있게 합니다.
Lakebase는 이를 가능하게 하기 위해 예측을 Postgres로 동기화하면서 동시에 앱에서의 업데이트를 저장합니다. 결과적으로 분석과 실시간 운영이 결합된 지원 포털이 생성됩니다. 이와 같은 접근 방식은 개인화 엔진 및 ML 기반 대시보드 를 포함한 많은 다른 사용 사례에도 적용됩니다.
ML 예측으로 풍부해진 사건 데이터는 델타 테이블에 존재하며, 스트리밍 파이프라인을 통해 거의 실시간으로 업데이트됩니다. 지원 앱을 구동하기 위해, 우리는 Lakebase 역방향 ETL을 사용하여 이 델타 테이블을 Postgres 테이블로 지속적으로 동기화합니다.
UI에서, 우리는 선택합니다:
이를 통해 앱이 최소한의 지연으로 최신 데이터를 반영하도록 보장합니다.
참고: Databricks SDK를 사용하여 동기화 파이프라인을 프로그래밍 방식으로 생성할 수도 있습니다.

지원 앱은 또한 소유권, 상태, 코멘트와 같은 사용자가 입력한 데이터를 저장할 테이블이 필요합니다. 이 데이터는 앱에서 작성되므로, Lakebase의 별도 테이블(동기화된 테이블이 아닌)로 들어가야 합니다.
다음은 스키마입니다:
이 디자인은 역방향 ETL이 단방향 (Lakehouse → Lakebase)으로 유지되도록 보장하면서, 여전히 앱을 통한 대화식 업데이트를 허용합니다.
Databricks 앱은 Lakebase와의 일류 통합을 지원합니다. 앱을 생성할 때, 단순히 Lakebase를 앱 리소스로 추가하고 Lakebase 인스턴스와 데이터베이스를 선택하면 됩니다. Databricks는 자동으로 앱의 서비스 주체에 대한 해당 Postgres 역할을 프로비저닝하여, 앱-데이터베이스 연결성을 간소화합니다. 그런 다음 이 역할에 필요한 데이터베이스, 스키마, 테이블 권한을 부여할 수 있습니다.

데이터가 동기화되고 권한이 설정되면, 이제 지원 포털을 구동하는 Flask 앱을 배포할 수 있습니다. 앱은 Postgres를 통해 Lakebase에 연결하고, 차트, 필터, 상호 작용성이 풍부한 대시보드를 제공합니다.
분석적 통찰력을 운영 응용 프로그램에 가져오는 것은 더 이상 복잡하고 취약한 과정일 필요가 없습니다. Lakebase를 사용하면, 역방향 ETL은 완전히 관리되고 통합된 기능이 됩니다. 이는 Postgres 엔진의 성능, 확장 가능한 아키텍처의 신뢰성, 그리고 Databricks 플랫폼의 거버넌스를 결합합니다.
지능형 지원 포털을 구동하든, 실시간 데이터 기반 경험을 구축하든, Lakebase는 엔지니어링 오버헤드를 줄이고 인사이트에서 행동으로 의 경로를 가속화합니다.
Lakebase에서 동기화된 테이블을 생성하는 방법 에 대해 더 알아보려면, 우리의 문서를 확인하고 오늘 시작해보세요.
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
