주요 컨텐츠로 이동
파트너

Lakebase의 최초 프로덕션 배포 중 하나 내부: LangGuard의 에이전트 워크플로우 거버넌스 엔진

엔터프라이즈 에이전트 워크플로는 수십 개의 에이전트, 수백 개의 도구, 15개 이상의 기록 시스템에 걸쳐 있습니다. 실시간으로 이를 제어하고 운영하려면 Lakebase가 등장하기 전에는 존재하지 않았던 인프라가 필요합니다.

작성자: Venkat Raghavan, Jason Keirstead, Ravi Srinivasan, Nina Williams , Amelia Westberg

  • 기업의 10% 미만이 성공적으로 자율 AI 에이전트를 대규모로 배포했으며, 이는 주로 에이전트가 런타임에 자체 로직을 생성하여 기존 보안 제어를 우회하고 보이지 않는 거버넌스 격차를 만들기 때문입니다.
  • Databricks는 Unity Catalog 및 AI Gateway를 통해 데이터, 모델 및 액세스 정책에 대한 통합 거버넌스를 제공합니다. LangGuard는 에이전트 워크플로를 위한 런타임 적용 계층으로 이러한 플랫폼 수준 제어를 확장하여 작업, 결정, 도구 및 자격 증명의 전체 체인에 걸쳐 정책을 모니터링하고 적용합니다. 이는 특허 출원 중인 GRAIL™ 데이터 패브릭을 사용하여 모든 에이전트 작업을 라이브 지식 그래프로 캡처하고 에이전트 성능에 영향을 주지 않고 실시간으로 모든 정책 결정을 평가합니다.
  • Databricks Lakebase는 레이크하우스 기반으로 구축된 업계 최초의 완전 관리형 서버리스 Postgres 데이터베이스로, 이를 가능하게 하며, 탄력적인 스케일 투 제로 컴퓨팅, 핫 운영 데이터에 대한 낮은 지연 시간 쿼리 실행, 안전한 거버넌스 정책 테스트를 위한 즉각적인 데이터베이스 브랜칭을 제공합니다.

Agentic AI의 보이지 않는 문제점

대부분의 기업은 자율 AI 에이전트를 실험하고 있습니다. 하지만 이를 안전하게 대규모로 배포하는 기업은 극히 드뭅니다. McKinsey의 "2025년 AI 현황" 설문조사(2025년 11월)에 따르면, 어떤 비즈니스 기능에서도 10% 이상의 기업이 AI 에이전트를 프로덕션 환경으로 확장하지 못했습니다. 실패는 야심이 부족해서가 아니라 가시성이 부족하기 때문입니다.

기존 소프트웨어와 달리 자율 에이전트는 즉석에서 자체 로직을 생성합니다. 이들은 기존 보안 모니터를 우회하고, 감사하기 어려운 방식으로 도구를 호출하고 데이터에 액세스하며, 단일 잘못된 권한 구성이나 정책 격차가 심각한 보안 사고로 확산될 수 있는 복잡한 다중 에이전트 워크플로우에서 작동합니다. 기업이 필요로 하는 것은 새로운 범주의 제어 인프라스트럭처입니다. 즉, 피해가 발생한 후에가 아니라 의사 결정이 이루어지는 순간에 작동하는 인프라스트럭처입니다.

이것이 LangGuard가 해결하기 위해 구축된 문제입니다.

런타임 강제 적용과 플랫폼 거버넌스의 만남

LangGuard는 에이전트가 접촉하는 모든 시스템에 걸쳐 작업, 결정, 도구, 자격 증명 및 의도를 전체적으로 모니터링하고 정책을 적용하는 에이전트 워크플로우를 위한 런타임 강제 적용 계층 역할을 합니다. Databricks는 데이터, 모델 및 액세스 정책에 대한 기록 시스템인 Unity Catalog와 AI Gateway를 통해 통합 거버넌스를 제공합니다. 기업이 에이전트를 프로덕션 환경에 배포함에 따라 워크플로우 자체도 이러한 플랫폼 수준의 제어를 각 에이전트 실행 단계까지 확장하는 런타임 강제 적용 계층이 필요합니다. LangGuard가 바로 이 지점에서 작동합니다. LangGuard의 거버넌스 엔진인 GRAIL™(Governance AI Run-time Links) 데이터 패브릭은 모든 에이전트 작업을 다차원 추적 데이터로 캡처하고 워크플로우 동작 및 컨텍스트에 대한 실시간 지식 그래프를 구축합니다. 에이전트가 도구를 호출하거나, 데이터 세트에 액세스하거나, 모델을 호출하려고 할 때 LangGuard는 정책에 대해 해당 작업을 평가하며, 워크플로우가 실행되는 모든 시스템에서, 그리고 어디에서 실행되든 관계없이 실행 전에 평가합니다.

프로덕션 엔터프라이즈 에이전트 배포의 규모는 이를 실제로 어렵게 만듭니다. 단일 워크플로우에는 수십 개의 조정된 에이전트, 수백 개의 도구 호출, 여러 개의 기본 모델, 그리고 ServiceNow와 같은 IT 티켓팅 시스템, IAM 및 IDP 플랫폼, Salesforce와 같은 CRM 시스템, Workday와 같은 HR 플랫폼, Wiz 및 CrowdStrike와 같은 클라우드 보안 플랫폼, TalkDesk와 같은 컨택 센터 플랫폼, MCP 게이트웨이 및 API 게이트웨이를 포함한 15개 이상의 엔터프라이즈 기록 시스템 전반에 걸쳐 관리되는 정책이 포함될 수 있습니다. 에이전트 성능에 영향을 주지 않고 이를 실시간으로 관리하려면 이 문제를 위해 특별히 구축된 인프라가 필요합니다.

Lakebase를 선택한 이유

LangGuard 팀은 수년간 IBM QRadar를 구축했습니다. QRadar는 여러 차례 Gartner Magic Quadrant 리더로 선정되었으며 세계에서 가장 널리 배포된 엔터프라이즈 SIEM 플랫폼 중 하나입니다. QRadar는 엄격한 지연 시간 및 안정성 요구 사항 하에 하루에 페타바이트의 보안 원격 분석 데이터를 수집하고 상관 분석합니다. 그 경험은 우리에게 어려운 교훈을 주었습니다. 데이터베이스 아키텍처가 운명을 결정한다는 것입니다. LangGuard의 워크플로우 거버넌스 엔진을 설계할 때, 우리는 이전에 해결했던 것과 동일한 문제에 직면했습니다. 예측할 수 없고 강렬한 버스트로 발생하는 운영 보안 데이터로, 모든 밀리초의 결정 지연 시간이 중요하고 유휴 인프라 비용이 용납되지 않는 문제입니다. 컴퓨팅과 스토리지를 결합하는 기존 데이터베이스는 피크 로드를 기준으로 프로비저닝하고 연중무휴 해당 용량에 대해 비용을 지불하도록 강제합니다. 컴퓨팅과 스토리지를 완전히 분리하고 버스트 사이에 제로로 확장되는 Lakebase의 서버리스 모델은 QRadar를 구축할 때 필요했지만 액세스할 수 없었던 솔루션이었습니다. 이 문제는 정확히 우리가 직면한 문제와 일치했습니다.

Lakebase가 적합한 이유

Lakebase는 컴퓨팅과 스토리지를 분리하는 새로운 범주의 운영 데이터베이스 아키텍처로, 컴퓨팅은 워크로드 수요에 따라 탄력적으로 확장할 수 있으며 내구성 있는 상태는 복제된 스토리지 계층에 독립적으로 존재합니다. PostgreSQL의 개방형 기반 위에 구축된 lakebase 아키텍처는 개발자가 입증된 관계형 데이터베이스에서 신뢰하는 모든 것을 유지하면서, 최신 앱, 에이전트 및 AI가 요구하는 속도와 규모에 기존의 단일체 RDBMS를 부적합하게 만드는 인프라 제약을 제거합니다.

서버리스 자동 확장 및 제로 확장

에이전트 동작은 매우 버스트하기로 악명 높습니다. 에이전트 워크플로우는 몇 시간 동안 완전히 비활성 상태였다가 갑자기 몇 초 만에 수백 개의 추적 쓰기 및 강제 적용 읽기를 생성할 수 있습니다. Lakebase는 이러한 추적이 시스템에 유입되는 정확한 순간에 동적으로 컴퓨팅 리소스를 프로비저닝하고 활동이 중지되면 완전히 종료됩니다. 내구성 있는 상태가 컴퓨팅 노드가 아닌 스토리지 계층에 존재하므로 새 컴퓨팅 인스턴스를 시작하는 데 데이터 이동이 필요하지 않습니다. 단순히 기존 데이터베이스 기록에 연결하고 즉시 쿼리 제공을 시작합니다.

기업 규모에서 운영되는 스타트업에게 이는 실제 사용량에 맞는 인프라와 조용한 기간에 대해 벌금을 부과하는 인프라의 차이입니다. 운영 비용은 실제로 제공하는 워크로드와 완벽하게 일치합니다.

핫 운영 데이터에 대한 밀리초 읽기 지연 시간

분리된 데이터베이스에 대한 일반적인 우려는 읽기 지연 시간입니다. Lakebase는 컴퓨팅과 스토리지 사이에 핫 데이터를 컴퓨팅에 가깝게 유지하는 캐싱 계층을 통해 이를 해결합니다.

LangGuard의 강제 적용 쿼리, GRAIL™ 컨텍스트 및 정책 테이블에 대한 엄격한 인덱싱 조회에서 활성 작업 세트가 컴퓨팅 로컬 메모리에 편안하게 맞을 것으로 예상합니다. 이 아키텍처는 거버넌스 결정이 에이전트 실행에 의미 있는 지연 시간을 추가하지 않고 워크플로우 속도로 적용될 수 있다는 확신을 줍니다.

거버넌스 정책 테스트를 위한 즉각적인 데이터베이스 분기

Lakebase의 즉각적인 데이터베이스 분기는 거버넌스 제품에 있어 가장 운영적으로 가치 있는 기능 중 하나입니다. 분기를 생성할 때 물리적으로 데이터를 복사하지 않습니다. 분기는 쓰기 시 복사 의미 체계를 사용하여 현재 데이터베이스 상태에서 분기되며, 새 데이터 또는 수정된 데이터에 대해서만 스토리지를 소비합니다. 개발자는 몇 초 만에 프로덕션 추적 데이터의 격리되고 정확한 복제본을 생성하고, 실제 에이전트 동작에 대해 새로운 거버넌스 정책을 테스트하고, 라이브 환경의 안정성을 위험에 빠뜨리지 않고 강제 적용 논리를 검증할 수 있습니다.

PostgreSQL: 입증된 기반

Lakebase는 수십 년 동안 모든 산업 분야에서 프로덕션 강화된 세계에서 가장 진보된 오픈 소스 관계형 데이터베이스인 PostgreSQL을 기반으로 구축되었습니다. LangGuard에게 이는 팀이 이미 알고 있는 도구, 라이브러리 및 확장 프로그램과의 완벽한 호환성을 의미하며, 독점 쿼리 언어나 마이그레이션 위험이 없습니다.

PostgreSQL

LangGuard와 Databricks는 어떻게 함께 작동하는가

LangGuard와 Databricks의 공동 아키텍처는 모든 운영 데이터를 단일의 신뢰할 수 있는 데이터 및 AI 플랫폼에 유지하면서 엔터프라이즈 에이전트 워크플로우를 엔드투엔드로 관리하도록 설계되었습니다. 아키텍처의 왼쪽에는 IT 서비스 관리, CRM, HR, ID, 보안, 컨택 센터 및 API/MCP 게이트웨이와 같은 수십 개의 기록 시스템과 상호 작용하는 AI 에이전트 및 오케스트레이터인 엔터프라이즈 에이전트 워크플로우 자체가 있습니다. 각 에이전트 작업, 도구 호출 및 데이터 액세스 요청은 실시간으로 LangGuard로 흐르는 풍부한 추적 이벤트를 생성합니다.

다이어그램의 중앙에는 특허 출원 중인 GRAIL™ 데이터 패브릭으로 구동되는 LangGuard 거버넌스 워크플로우 엔진이 있습니다. GRAIL은 모든 에이전트 작업을 다차원 추적 데이터로 캡처하고 워크플로우 동작 및 컨텍스트에 대한 실시간 지식 그래프를 구축합니다. 에이전트가 도구를 호출하거나, 데이터 세트에 액세스하거나, 모델을 호출하려고 할 때 LangGuard는 이 실시간 컨텍스트와 관련 거버넌스 규칙에 대해 정책 평가를 수행하여, 작업이 실행되기 전에 허용/거부/수정 결정을 반환합니다. 이를 통해 기업은 기본 에이전트가 실행되는 위치에 관계없이 워크플로우가 접촉하는 모든 시스템에서 정책을 적용할 수 있는 단일 제어 지점을 확보할 수 있습니다.

오른쪽에는 Databricks Lakebase가 LangGuard의 추적 및 정책 데이터에 대한 운영 기록 시스템 역할을 합니다. Lakebase의 서버리스, PostgreSQL 아키텍처는 컴퓨팅과 스토리지를 분리하여 에이전트 활동 버스트 사이에 탄력적인 자동 확장 및 제로 확장을 가능하게 하는 동시에 핫 운영 데이터를 컴퓨팅 근처의 저지연 캐시에 유지합니다. LangGuard는 지속적으로 Lakebase에 추적 이벤트를 쓰고 거버넌스 정책 조회 및 컨텍스트 쿼리에 대해 저지연 읽기를 수행하여, 데이터베이스 용량을 과도하게 프로비저닝하지 않고 워크플로우 속도로 강제 적용 결정을 내릴 수 있도록 합니다.

LangGuard의 운영 데이터가 Lakebase에 네이티브로 존재하므로 추가 ETL 없이 분석 및 AI를 위해 더 넓은 Databricks Data Intelligence Platform에서 즉시 사용할 수 있습니다. Databricks AI, Model Serving 및 MLflow는 GRAIL 추적 데이터에서 직접 이상 탐지 모델을 학습하고 배포하여 설정된 동작 기준선에서 벗어나는 에이전트를 식별할 수 있습니다. 이러한 예측 신호는 LangGuard 거버넌스 엔진으로 다시 피드백되어 실시간 강제 적용과 예측 모니터링 간의 루프를 닫고, 기업이 단일 플랫폼에서 반응형 제어에서 행동 기반의 사전 예방적 AI 거버넌스로 전환할 수 있도록 합니다.

다음 단계: 에이전트 워크플로우를 위한 예측 거버넌스

LangGuard의 엔진은 오늘날 전체 워크플로우에 걸쳐 런타임에서 기존 정책을 시행합니다. 다음 진화는 예측적입니다. 즉, 정책 위반으로 나타나기 전에 이상 행동을 감지하기 위해 과거 GRAIL 추적 데이터에 대한 행동 모델을 훈련하는 것입니다.

앞서 설명한 대로 운영 추적 데이터가 이미 Databricks 생태계에 있기 때문에 별도의 ETL 파이프라인을 구축하거나 두 번째 분석 플랫폼을 구축하지 않고도 시행에서 예측으로 직접 이동할 수 있습니다.

에이전트가 비정상적으로 작동하거나 설정된 기준선에서 벗어나기 시작하면 해당 모델은 손상이 발생하기 전에 이상 징후로 표시합니다. 실시간 시행과 예측 머신러닝의 이러한 융합은 엔터프라이즈 AI 거버넌스의 미래이며, 오늘날 우리가 구축하고 있는 아키텍처입니다.

핵심 요약
LangGuard는 Databricks Lakebase에서 프로덕션 인프라를 구축하는 최초의 스타트업 중 하나입니다. 이 선택은 특정 요구 사항 세트, 즉 낮은 지연 시간 시행, 탄력적인 버스트 처리, 실제 데이터에 대한 거버넌스 정책 테스트에 의해 주도되었습니다. 서버리스 OLTP 데이터베이스만이 이 모든 것을 만족시킬 수 있습니다. Lakebase는 이 모든 것을 충족하는 최초의 데이터베이스입니다.
체인의 모든 에이전트, 도구, 자격 증명 및 기록 시스템에 걸쳐 에이전트 워크플로우를 엔드투엔드로 관리해야 하는 기업의 경우 이 아키텍처는 워크플로우 속도로 작동하고 배포 복잡성에 따라 확장되며 별도의 데이터 플랫폼 없이 예측 행동 보안을 향해 발전하는 시행을 의미합니다.

에이전트 워크플로우를 엔드투엔드로 관리할 준비가 되셨습니까? langguard.ai를 방문하여 LangGuard가 전체 정책 규정 준수를 통해 엔터프라이즈 에이전트 워크플로우를 보호, 제어 및 운영하는 방법을 알아보거나 Databricks Lakebase를 탐색하여 서버리스 OLTP 인프라가 실시간 AI 거버넌스를 확장하는 방법을 확인하십시오.

LangGuard에 대해 자세히 알아보기 Databricks Lakebase 탐색하기

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

최신 게시물을 이메일로 받아보세요

블로그를 구독하고 최신 게시물을 이메일로 받아보세요.