Databricks 데이터 인텔리전스 플랫폼이 사일로화된 AML 시스템, ML 위험 평가, 다양한 AI 에이전트를 경보(alert)부터 SAR 제출까지 하나의 거버넌스된 워크플로우로 통합하는 방법
작성자: Kateryna Savchyn , Pavithra Rao, Mimi Park , Emerson Bayuk
금융 서비스의 자금세탁방지(AML) 기능은 역사적으로 두 가지 책임, 즉 잠재적인 자금세탁 활동에 대한 경고를 해제하고, 필요한 경우 의심거래보고(SAR)를 제출하는 것을 포함하여 모든 사례의 처리 결과를 기록하는 동시에 프로그램의 효과성과 프로세스 감사 가능성을 유지하는 것을 중심으로 구성되어 왔습니다. 이 모델은 현재 압박을 받고 있습니다. 진화하는 금융 범죄 유형, 실시간 설명 가능성에 대한 규제 당국의 기대, 생성형 AI의 성숙은 현대적인 AML 실무의 모습을 재정의하고 있습니다. AML 리더들은 분석가의 시간을 오늘날 업무의 대부분을 차지하는 데이터 수집, 오탐(false-positive) 분류, 보고서 초안 작성 대신 실제 금융 범죄 인텔리전스에 집중하도록 요구받고 있습니다.
제약 요인은 인재나 의지가 부족해서가 아닙니다. 분산된 시스템, 불투명한 벤더 스코어링, 수동 증거 수집으로 인해 모든 경고에 가해지는 구조적 지체 때문입니다. 이러한 지체 요인이 제거되지 않는 한, AML 프로그램은 아무리 많은 자금이 지원되더라도 미처리 업무를 해결하는 수준에 머무를 수밖에 없습니다.
오늘날 일반적인 AML 조사 주기는 수동으로 진행되며 오류가 발생하기 쉽습니다. 분석가들은 고객 확인 제도(KYC), 거래 모니터링, 제재 대상 스크리닝, 케이스 관리, 부정적 미디어 보도, 실소유주 확인, 내부 CRM, 지점 로그, 규제 지식 베이스를 포함하여 10개 이상의 분산된 시스템에서 데이터를 추출하고 연관성을 분석하는 데 케이스당 3~6시간을 소비하며, 이 데이터들은 스프레드시트와 Word 템플릿에 수동으로 취합됩니다. 이 시간의 대부분은 오탐(false positive)에 소요됩니다. PwC는 거래 모니터링 시스템에서 생성되는 모든 경고의 90~95%가 조치가 필요 없는 것으로 추정하지만, 증거를 자동으로 연결해 주는 장치가 없기 때문에 각 경고는 실제 탐지 건과 동일한 조사 노력을 소모합니다. 1세대 규칙 기반 모니터링은 현대적인 AI 기반 금융 사기 기법에 점점 더 뒤처지고 있습니다.
이러한 지체 현상은 다음 네 가지 영역에서 나타납니다.
누적된 결과로 미처리 업무가 인력 충원 속도보다 빠르게 증가하고 있습니다. PwC EMEA AML Survey 2024에 따르면, 금융 기관의 44%가 금융 범죄 규제 강화를 준법 감시 운영을 복잡하게 만드는 가장 시급한 요인으로 꼽았으며, 향후 10년 동안 나타날 새로운 유형(실시간 결제, 임베디드 금융, 가상자산-법정화폐 브릿지, 대규모 합성 신원 등)은 이 격차를 더욱 벌려놓을 것입니다.
미처리 업무 해결에서 본격적인 조사 단계로 나아가기 위해, AML 팀은 단순히 경고를 저장하는 것을 넘어 이를 분석하고 규제 당국이 기대하는 거버넌스 태세를 갖춘 플랫폼이 필요합니다. Databricks Data Intelligence Platform은 거래 모니터링, KYC, 제재 대상 스크리닝, 규제 지식, AI 에이전트를 Unity Catalog 거버넌스 하에 통합하여 원시 거래부터 제출된 SAR까지 전체 계보(lineage)를 제공합니다. 각 구성 요소는 전부가 아니면 전무한 방식이 아니라 모듈식으로 구성되어 있어, 금융 기관은 전체 스택을 엔드투엔드로 도입하거나 개별 요소를 기존 워크플로우에 계층화하여 적용할 수 있으며, 이는 이제 막 현대화를 시작하는 팀에 특히 유용합니다. 기존 AML 스택과 차별화되는 이 접근 방식의 6가지 핵심 역량은 다음과 같습니다.
Unity Catalog는 10개 이상의 분산된 시스템을 거버넌스가 적용된 단일 레이크하우스로 통합합니다. 코어 뱅킹, 거래 모니터링 스트림, KYC 프로필, 제재 대상 적발 내역, 케이스 이력, 금융 기관의 AML 정책 문서 라이브러리는 Lakeflow Connect를 통해 Bronze → Silver → Gold 메달리온 아키텍처로 수집됩니다. 이 과정에서 Delta 기반의 데이터 품질 보장, 고객 PII(개인정보)에 대한 컬럼 마스킹, 팀 및 역할에 따른 행 수준 보안이 적용됩니다. 모든 다운스트림 아티팩트, 위험 점수, 에이전트의 증거 체인, SAR 보고서는 원본 행과 수집 타임스탬프까지 계보가 추적됩니다. 조사관이 경고를 유발한 원인, 제출을 뒷받침하는 증거, 또는 금융 기관이 구조적으로 유사한 케이스를 처리한 방식을 물 을 때, 분석가의 기억에 의존하는 대신 재현 가능한 쿼리로 답변할 수 있습니다. 거버넌스, 계보 추적, 품질 강제 적용은 별도의 추가 기능이 아니라 플랫폼 자체의 기본 속성입니다.
정적 규칙 엔진은 대체되는 것이 아니라 보완됩니다. Databricks Data Intelligence Platform은 데이터 과학 및 금융 범죄 대응 팀이 금융 기관 고유의 거래 이력, 고객 기반, 위험 프로필에 맞춤화된 최첨단 ML 모델을 개발, 학습 및 서빙할 수 있는 기반을 제공하여 경고 대기열과 조사 컨텍스트 모두에 더 풍부한 신호를 제공합니다. 모델은 챔피언/챌린저 에일리어스 및 전체 실험 추적 기능과 함께 MLflow에 등록되며, Model Serving은 활성 모델을 노출하고, Lakehouse Monitoring은 프로덕션 환경에서의 드리프트와 성능을 관찰하며, 추론 테이블은 챌린저 재학습에 반영되는 분석가의 피드백을 캡처합니다. 챌린저 모델의 우수성이 입증되면 팀은 MLflow의 수명 주기 관리를 통해 이를 승격시킵니다. 모든 경고는 이를 유발한 비즈니스 규칙과 ML 신호에 대한 설명을 표시할 수 있으므로, 분석가는 케이스가 왜 대기열에 들어왔는지 이미 파악한 상태에서 조사를 시작할 수 있습니다. 그 결과, 기존의 거래 모니터링 규칙 엔진을 완전히 교체하지 않고도 분석가 대기열에 도달하는 오탐을 75% 줄일 수 있습니다.
현대화의 핵심은 Agent Bricks