주요 컨텐츠로 이동

Azure Databricks에서 GenAI를 이용한 복잡한 계약 해독

어떻게 고급 분석과 Databricks가 계약 검토 시간을 92% 줄이고 새로운 비즈니스 통찰력을 찾아냈는지

Cracking Complex Contracts with GenAI on Azure Databricks

Summary

  • 처리 시간 95% 감소: 이전에 최대 2일이 걸리던 계약 분석이 이제 몇 시간 안에 완료됩니다
  • 향상된 정확도: 솔루션은 SME에 의해 검증된 약 90%의 정확도를 달성합니다
  • 향상된 가시성: 핵심 고객 속성의 중앙 집중식 데이터베이스는 지역 팀 간의 협업을 향상시킵니다

진단 건강 관리 제품의 선도적인 제조업체에서는 EMEA 지역 전체의 계약 관리가 중요한 도전 과제였습니다. 계약서가 여러 지역 플랫폼에 분산되어 있고 계약 관리자가 개별적으로 관리하므로, 중요한 데이터를 추출하는 것은 수동적이고 노동 집약적인 과정이었으며 계약 당 최대 2일이 소요되었습니다. 이런 파편화된 접근 방식은 판매 성과를 저해하고, 운영 비용을 증가시키며, 전략적 의사결정을 늦추었습니다.

Advancing Analytics와 Databricks와 협력하여, 이 회사는 계약 분석 과정을 변화시키는 혁신적인 생성 AI 솔루션을 구현했으며, 놀라운 효율성 향상과 비즈니스 인사이트를 제공하였습니다. 이들이 어떻게 그것을 달성했는지 여기에 있습니다.

도전: EMEA 전역의 계약 복잡성

이 회사의 광범위한 제품 포트폴리오는 전 세계에서 사용되는 진단 제품을 포함합니다. 그러나 그들의 계약 관리 과정이 그들을 제약하고 있었습니다:

  • 계약 데이터가 여러 지역 플랫폼에 분산되어 있었습니다
  • 계약 관리에 대한 중앙화 또는 표준화된 접근 방식이 없음
  • 수동 검토 과정에서 계약 관리자들은 전체 문서를 검토해야 했습니다
  • 계약서는 디지털 문서, 손으로 쓴 문서, 스캔된 문서의 혼합입니다
  • 핵심 속성 추출에는 계약당 최대 2일이 소요되었습니다
  • 다국어 계약서 (영어, 프랑스어, 독일어)로 복잡성 증가

"우리 계약 관리자들은 기본 정보를 추출하기 위해 각 계약에 거의 2일을 소비하고 있었습니다,"라고 회사 임원이 설명합니다. "EMEA 전역에 수백 개의 계약이 있음에도 불구하고, 이 수동적인 접근 방식은 지속 가능하지 않았으며, 우리가 전략적 결정을 내리기 위해 필요한 통찰력을 얻는 것을 방해하였습니다."

해결책: Advancing Analytics가 Databricks에서 구축한 Gen AI 기반 파이프라인

Advancing Analytics와의 파트너십을 통해 회사는 Azure Databricks에서 end-to-end로 실행되는 검색-증강 생성(RAG) 파이프라인을 구축하였습니다:

  • SharePoint에서 자동으로 가져온 PDF는 Unity Catalog에 의해 관리되는 Delta 테이블에 저장되며, 완전한 감사 추적이 가능합니다.
  • Azure AI Document Intelligence는 스캔, 필기 및 혼합 언어에 대해 OCR을 수행합니다.
  • 프랑스어와 독일어, 그리고 영어가 아닌 모든 텍스트는 일관된 하류 처리를 위해 번역 모델을 통해 전달됩니다.
  • 청크는 모자이크 AI 벡터 검색에 임베디드되어 인덱싱되어, 밀리초 단위의 유사성 검색을 제공합니다.
  • LLM 엔드포인트의 앙상블(Databricks 호스팅 및 Azure OpenAI)이 적절한 덩어리를 끌어내고 약 100개의 속성을 추출하여, JSON-보정 체인으로 출력을 강화합니다.

새 파일은 큐 속성, 항목, 실행 시간, 실패에 대한 전체 추적 가능성을 가진 사용자 정의 Unity Catalog 기반 큐 시스템에서 처리됩니다. 이를 통해 시스템은 자원을 효과적으로 균형있게 관리하면서도 규모가 크게 확장 가능한 대기열을 제공할 수 있습니다. 또한 모든 입력 파일의 처리 속도와 결과가 완전히 보이고 추적 가능하도록 보장합니다.

새로운 앙상블 접근법: 신뢰할 수 있는 정확도

대부분의 추출 파이프라인은 단일 모델을 신뢰합니다. 우리는 그렇게 하지 않습니다. 2024년 연구 논문 Probabilistic Consensus through Ensemble Validation (arXiv:2411.06535)에 영감을 받아, 우리는 세 개의 LLM을 병렬로 실행하고, 적어도 두 개가 동의할 때만 값을 수용합니다. 효과는 극적입니다:

  • 신뢰할 수 있음: 처리량을 저하시키지 않고 환각을 잡아냅니다
  • 모델에 구애받지 않음: 더 저렴하거나 도메인 특정 모델을 교체하더라도 품질을 높게 유지
  • 감사 수준의 추적 가능성: 모든 불일치는 전문가 검토를 위해 기록됩니다

이것은 다국어로 된 규제된 계약을 위한 Databricks 레이크하우스에서 운영되는 최초의 앙상블 검증된 GenAI 솔루션 중 하나라고 우리는 믿습니다.

신뢰할 수 있는 워크플로우와 방해받지 않는 업데이트

해결책의 워크플로우는 문서 수집부터 SharePoint를 통해 최종 출력물을 Excel 파일과 사용자 정의 대시보드로 전달하는 것까지 완전히 자동화되어 있습니다. Databricks 워크플로우는 이 과정이 정기적으로 발생하도록 하여, 자원 프로비저닝과 비용 예측에 도움이 되는 예측 가능한 트래픽률을 제공합니다.

이 과정에 대한 업데이트와 개선 사항은 Databricks Asset Bundles를 중심으로 강력한 CI/CD 파이프라인을 통해 개발 환경에서 생산 환경으로 전파됩니다. 이를 통해 노트북, 워크플로우, 리소스가 동기화되어 유지되며, 진행 중인 생산 작업에 방해를 주지 않고 원활하게 업데이트됩니다.

실제 비즈니스 영향

Advancing Analytics가 이 Databricks 기반 솔루션을 구현함으로써 상당한 비즈니스 가치를 창출하였습니다:

  • 처리 시간 95% 감소: 이전에 최대 2일이 걸리던 계약 분석이 이제 몇 시간 안에 완료됩니다
  • 향상된 정확도: 이 솔루션은 SMEs에 의해 검증된 약 90%의 정확도를 달성합니다.
  • 향상된 가시성: 핵심 고객 속성의 중앙화된 데이터베이스는 지역 팀 간의 협업을 향상시킵니다
  • 확장성: 해결책은 광범위한 문서 백로그와 ad-hoc 처리 요구 사항을 효율적으로 처리합니다
  • 다국어 처리 능력: 영어, 프랑스어, 독일어 및 최대 15개의 다른 언어로 계약을 원활하게 처리합니다

이 회사에 대해 이 솔루션은 연간 수백만 달러의 절약, 거래 주기의 가속화, 그리고 강력한 새로운 능력을 의미합니다: 자연어를 사용하여 모든 EMEA 계약을 즉시 조회합니다.

이제 주제 전문가들은 문서에 묻혀 있거나 표준 테이블에 기록되지 않았던 인사이트와 속성을 챗봇에게 물어볼 수 있습니다.

더욱이, 이 과정은 92% 빠르며, 완전히 자동화되어 있기 때문에 전문가들은 거의 시간을 들이지 않고 관리할 수 있습니다. 대신, 그들은 시스템이 무거운 작업을 처리하는 동안 더 높은 가치의 작업에 집중할 수 있습니다.

왜 성공했는지

  • 하나의 플랫폼, 제로 실로: Databricks는 ETL, 벡터 검색, LLM 서빙 및 거버넌스를 통합했습니다.
  • 하이브리드 모델 전략: Mosaic AI 모델 서빙 엔드포인트를 사용하여 비용이나 정확도에 따라 모델을 교체하면 코드를 다시 연결할 필요가 없습니다
  • 인간 중심: SMEs는 초기 실행을 검증하고 엣지 케이스를 프롬프트 템플릿으로 다시 제공하여 정밀도를 크게 향상시켰습니다
  • 배포 규율: Asset Bundles과 워크플로우는 CI/CD를 제공하여 환경 간의 변경 전파가 라이브 프로세스를 방해하지 않고 성공적으로 이루어지도록 보장합니다

앞으로의 전망: 영향력 확대

계약 분석 솔루션의 성공으로, 회사는 이제 그들의 운영 전반에 걸쳐 생성 AI의 추가적인 응용을 탐색하고 있습니다. Databricks에서 Advancing Analytics가 구축한 확장 가능한 아키텍처는 미래의 혁신을 위한 기반을 제공하며, 제품 개발, 규제 준수, 고객 서비스 등의 잠재적 응용이 가능합니다.

이 구현은 조직이 어떻게 Databricks와 Azure에 대한 Advancing Analytics의 전문 지식을 활용하여 복잡하고 수동적인 과정을 효율적이고 자동화된 워크플로우로 변환하여 실제 비즈니스 가치를 제공할 수 있는지 보여줍니다. 생성 AI의 힘을 견고한 데이터 관리 및 거버넌스와 결합함으로써, 회사는 이전에는 비구조화된 데이터에 숨겨져 있던 인사이트를 발굴할 수 있어, 더 나은 의사결정과 운영 탁월성을 추구할 수 있습니다.

이 프로젝트는 데이터, AI, 도메인 전문성이 어떻게 결합하는지에 대한 청사진입니다. 우리는 단순히 프로세스를 가속화하는 것이 아니라, 전략적 자산을 해제했습니다. — Dr. Gavita Regunath, Chief AI Officer, Advancing Analytics

기업들이 복잡한 문서의 증가하는 양에 계속해서 대응하면서, 이 사례 연구는 Advancing Analytics와 Databricks가 문서 문제를 전략적인 이점으로 바꿀 수 있는 매력적인 청사진을 제공합니다.

데이터 & AI 리더들을 위한 세 가지 주요 포인트

  1. 비즈니스 고통에서 시작하십시오: 주기 시간, 비용, 위험은 모든 디자인 선택을 안내했습니다
  2. 거버넌스를 구축하십시오, 그렇지 않으면: Unity Catalog와 Delta Lake는 첫날부터 보안 팀을 만족시켰습니다
  3. GenAI를 플랫폼 기능으로 취급하십시오: Vector Search, AI Functions 및 Mosaic AI가 구축되어 있으면, 새로운 문서 중심의 사용 사례는 몇 주, 몇 달이 아닌 시간이 소요됩니다.

 

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요