2023년 7월 23일

데이터브릭스 Lakehouse 기반으로 신용 데이터 플랫폼 구축하기

금융 포용성을 향해 장벽을 깨트리기

작성자: Nuwan Ganganath, Boris Banushev , 리카르도 포르티야

dbdemos.ai의 데모에서부터 신용데이터 플랫폼 구축을 시작할 수 있습니다.

서론

World Bank의 금융 포용성 보고서에 따르면, 무려 17억 명에 달하는 성인이 금융 소외 계층으로 분류되었습니다. 많은 금융소외계층은 기존 금융기관에서 대출을 받기 어렵기 때문에 높은 이자율로 대출을 제공하는 비공식 대부업체를 찾게 됩니다. 이 그룹에는 일반적으로 젊은 세대, 개발도상국의 저소득층, 농촌 거주자가 포함되며, 이들 중 상당수는 모바일 환경에서 금융 서비스를 이용하고 있습니다.

금융 소외 문제 관련하여, 전통적인 은행 서비스가 취약한 영역의 금융 소비자 요구를 충족하기 위해 모바일 뱅킹이 등장했습니다. 전 세계 스마트폰 사용자 수는 지난 5년간 매년 최소 5%씩 꾸준히 증가해 왔으며, 이는 대출 분야에서 새롭고 유망한 기회를 제시하고 있습니다. 금융 기관은 머신러닝 및 기타 고급 분석을 활용하여 고객의 신용도를 평가하고 플랫폼을 통해 점진적으로 신용 이력을 구축함으로써 금융 포용의 범위를 넓히고 이전에는 얻을 수 없었던 신용 기회에 대한 문을 열어 이 기회를 활용할 수 있습니다.

금융 포용의 정신과 전통적인 사고의 확장 차원에서, 이 블로그는 은행, 핀테크 기업, 비은행 금융기관이 이러한 새로운 시장, 즉 더 나은 금융 서비스에 대한 기대와 열망이 있고 쉽게 결실을 얻을 수 있는 시장에 어떻게 진입할 수 있는지에 대한 가이드와 재사용가능한 공개 Lakehouse 데모를 제공합니다.

신용 확장 - 잘 하는 것과 좋은 일을 하는 것은 모순되지 않습니다

딜로이트가 금융 포용성에 관한 보고서에서 언급했듯이, '잘하는 것과 좋은 일을 하는 것이 모순되지 않는다'는 점은 업계의 많은 데이터 팀에게 공감을 불러일으키고 있습니다. 이 개념을 더 잘 이해하기 위해 몇 가지 용어를 정의해 보겠습니다.

신용 결정은 대출 또는 신용 상환 능력과 관련된 개인의 신용도를 평가하는 프로세스입니다. 이는 대출 산업에서 필수적인 부분이며 데이터 수집, 데이터 처리, 데이터 분석과 손실 추정 등 다양한 단계가 포함됩니다. 전통적으로 신용 결정은 금융소외계층이 가장 많이 이용하는 대출 유형인 단기 대출의 경우에도 오랜 시간이 걸리는 과정이었습니다. 게다가 이 과정은 과거 신용 기록이 있거나 장기 대출을 받은 개인에게 크게 편향되어 있었습니다. 선구매 후상환(BNPL) 상품, 주택 구매를 위한 디지털 금융 시장, 신용을 제공하는 비은행 금융기관의 등장으로 신용 결정을 위한 무대가 완전히 바뀌었습니다.

AI 기반의 신용 의사 결정이 계속 발전함에 따라 은행 및 결제 업계에서는 데이터브릭스 레이크하우스 설계에 대한 고객 수요가 급증하고 있습니다. 이 설계는 신용 의사 결정 프로세스에 대한 총체적이고 효율적인 솔루션을 제공하는 신용 데이터 플랫폼을 제공합니다. 이 플랫폼은 데이터 통합, 감사, AI 기반 의사 결정, 설명 가능성을 지원하여 데이터 분석을 위한 신뢰할 수 있는 단일 소스를 제공할 수 있습니다. 신용 데이터 플랫폼에는 방대한 양의 데이터를 분석하고 대출자의 신용도를 보다 정확하게 예측할 수 있는 머신러닝 모델이 포함되어 있어 신용 의사 결정 프로세스의 속도와 정확성을 개선합니다. 신용 데이터 플랫폼은 금융 서비스를 제공하려는 핀테크, 은행 또는 비은행 금융기관이 정보에 기반한 신용 의사 결정을 내리고 채무 불이행 위험을 줄이며 고객에게 더 나은 금리와 조건을 제공하는 데 도움이 될 수 있습니다. 기술 솔루션에 대해 자세히 알아보기 전에 오늘날 금융 기관이 시장에 서비스를 제공하기 위해 고군분투하고 있는 분야를 살펴보겠습니다.

Part I - 왜 변화가 필요한가?

은행이 직면한 도전과제들

신용 데이터 플랫폼을 구축하는 것은 아래와 같은 이유에서 은행과 다른 금융기관들에 중요한 도전과제가 될 수 있습니다.

Challenge #1 - 기존 데이터 부족

좋은 신용 모델링은 대규모 데이터 큐레이션 작업입니다.

많은 금융소외계층은 기존 금융기관에서 대출을 받기 어렵기 때문에 높은 이자율로 대출을 제공하는 비공식 대부업체를 찾게 됩니다. 금융소외계층 고객은 신용도를 평가하는 데 사용할 수 있는 전통적인 신용 이력이나 재무 기록이 없을 수 있기 때문에 신용 의사 결정을 내리는 것이 어려울 수 있습니다. 게다가 신용 의사 결정 데이터는 서로 다른 소스와 호환되지 않는 형식으로 저장되는 경우가 많기 때문에, 데이터 사용자가 데이터를 완전히 통합하여 가치 있는 인사이트를 추출하기가 어렵습니다. 그 결과 데이터 엔지니어와 과학자만 데이터를 사용할 수 있고, 마케팅 및 재무팀, 콜센터 상담원, 은행 창구 직원과 같은 최종 사용자는 데이터를 사용할 수 없는 경우가 많습니다.

Challenge #2 - 보안과 거버넌스

제한없는 데이터 액세스가 거버넌스 없이 운영되는 것을 의미하지는 않습니다.

은행과 기타 금융 기관은 신용 데이터 플랫폼을 구축할 때 중요한 어려움에 직면합니다. 무엇보다, 플랫폼이 안전하고 규제 요건을 준수하며 민감한 고객 데이터를 보호하는지 확인해야 합니다. 이러한 목표를 달성하려면 데이터 개인정보 보호, 액세스 제어, 품질, 규정 준수 등 보안 및 거버넌스와 관련된 다양한 과제를 해결해야 합니다. 그러나 데이터 거버넌스 및 엔터프라이즈 보안 제어는 데이터 에코시스템의 복잡성, 진화하는 위협, 내부자 위험, 리소스 제약으로 인해 어려울 수 있습니다. 데이터를 효과적으로 관리하고 보안을 유지하려면 조직은 이러한 문제를 근본적으로 해결해야 하며, 이는 뒤로 미룰 수 없는 일입니다.

Challenge #3 - 설명가능성과 공정성

"데이터 인사이트"를 실행 가능한 것으로 만들어야 합니다.

설명 가능성과 공정성은 소비자를 차별로부터 보호하고 공평한 결과를 보장할 수 있도록, 편견 없고 이해하기 쉬운 결정을 내리는데 기반이 되므로, 신용 결정에 있어 필수적입니다. 공정성과 설명가능성이 부족하면 신용 시스템에 대한 신뢰가 약화되고 소비자가 신용 신청을 꺼릴 수 있습니다. 그러나 신용 결정의 공정성을 평가하고 결과를 설명하는 것은 여러 가지 요인으로 인해 어려울 수 있습니다. 여기에는 신용 점수 모델의 복잡성, 잠재적인 데이터 편향성, 사람의 편견 가능성 등이 포함됩니다.

신용 의사결정 솔루션

이 블로그에서는 데이터브릭스 레이크하우스를 통해 올바른 데이터 기반 플랫폼을 구축하여, 앞서 언급한 과제를 해결하고 기업이 더 나은 신용 모델을 만들 수 있는 방법을 설명합니다. 이를 통해 금융 소외 고객 서비스, 신용 위험 및 노출 평가, 선구매 후지급과 같은 새로운 상품 도입 등 비즈니스 목표를 달성할 수 있습니다.

Credit Decisioning on the Databricks Lakehouse

좋은 신용 모델을 만들려면 은행 고객의 소비 습관, 잠재적인 이전 연체 기록, 수입원 등 가능한 한 다양한 각도에서 고객을 묘사하는 광범위한 데이터가 필요합니다. 그림 왼쪽에는 신용 조사 기관 데이터, 고객 정보, 실시간 거래 데이터, 파트너 데이터(기존 은행 정보를 보강하는 데 사용하는 통신사 데이터) 등 최신 신용 의사 결정 플랫폼을 만드는 데 필요한 다양한 금융 데이터 소스가 표시되어 있습니다. 모든 데이터 소스의 파일 형식, 수집 속도, 볼륨, 소스 플랫폼이 완전히 다르다는 것을 쉽게 알 수 있습니다.

데이터 통합

이런 다양한 데이터를 다루기 위해 모든 데이터 소스를 단일 데이터 원본(single source of truth) 위치에서 수집하는 기능인 데이터 통합부터 시작합니다.

선언적 ETL 프레임워크인 델타 라이브 테이블(DLT)을 이용하여 안정적이고 유지보수 가능하며 테스트 가능한 데이터 처리 파이프라인을 구축할 수 있습니다. DLT를 사용하면 여러 데이터 소스를 단일 파이프라인, 저장 위치 및 파일 형식인 델타 레이크(Delta Lake)로 수집하는 과정을 간소화할 수 있습니다. 델타 레이크는 시간 이동, 스키마 적용 및 탐지, 스트리밍 데이터와 배치 데이터를 병합하는 기능과 같은 기능을 통해 최신 데이터 플랫폼의 초석인 안정성과 성능을 제공합니다. 오늘날 모든 데이터는 실시간에 가까운 스트리밍 방식으로 수집되며, DLT는 인프라 프로비저닝을 위한 '방법'이 아닌 '내용'에 집중할 수 있는 간단한 인터페이스를 제공합니다.
데이터 통합은 또한 모든 데이터가 동일한 위치에 동일한 형식으로 저장되어 거버넌스 및 보안이 간소화된다는 것을 의미합니다. 신용 평가에는 많은 개인 식별 정보(PII)가 포함된 원천 데이터가 필요합니다. 데이터브릭스 거버넌스 솔루션인 유니티 카탈로그(Unity Catalog)를 통해 데이터의 사용성과 활용성을 저해하지 않으면서도 최고 수준의 보안을 손쉽게 달성할 수 있습니다. 유니티 카탈로그를 사용하면 비정형 데이터나 스트림 데이터 등 데이터 형식에 관계없이 간단한 SQL 문을 사용하여 세분화된 테이블 액세스 제어(ACL)를 쉽게 적용하고, 행 및 열 수준 필터링과 마스킹을 적용하고, 외부 위치 및 스토리지 자격 증명을 관리할 수 있습니다.

데이터 의사결정

적절한 데이터 기반이 설정되면 데이터 의사 결정으로 이동하여 "데이터 인사이트"라고 부르는 숨겨진 패턴과 상관관계를 찾을 수 있습니다:

금융 서비스 산업에서 데이터 제품을 성공적으로 구축하려면 효과적인 팀 간 협업이 매우 중요합니다. MLFlow의 "투명한" AutoML 기능은 데이터브릭스 Feature Store의 검색 기능과 계보(lineage), 데이터브릭스 Notebooks에 통합된 GUI 기반 데이터 프로파일링 및 대시보드를 이용하여, 자동화된 실험, 모델 선택, 하이퍼파라미터 튜닝을 통해 기준 모델을 매우 빠르게 생성할 수 있게 해줍니다.
이미 언급했듯이, 데이터 인사이트와 머신 러닝 예측이 설명 가능하고 공정하며 실행 가능하지 않으면 노트북에만 머물 가능성이 매우 높습니다. 이 데모에서는 SHAP (SHapley Additive exPlanations)을 사용하여 "신용 가치에 기여하는 요소" 또는 "특정 고객이 채무 불이행을 하는 이유"와 같은 세부 정보를 제공함으로써 통계를 비즈니스 프로세스와 연결하여 신용 상담원과 마케팅 팀이 각 고객에게 개별적으로 더 쉽게 대응할 수 있도록 합니다.

데이터 민주화

오늘날 데이터는 데이터 과학자나 데이터 엔지니어와 같은 데이터 팀만 액세스하고 사용할 수 있는 경우가 많습니다. 그러나 데이터 팀은 여신 결정과 같은 사용 사례의 최종 사용자가 아닙니다. 최종 사용자는 신청서를 평가하는 여신 상담원, 고객과 소통하는 콜센터 상담원, 은행 이용이 어려운 고객을 업셀링하기 위한 홍보 자료를 준비하는 마케팅 팀 등 입니다. 그러나 이러한 현업 담당자들은 데이터나 대시보드 또는 기계 학습 예측에 액세스할 수 없는 경우가 많습니다. 예전에는 데이터 팀에서 요청된 데이터를 CSV 또는 PDF 파일로 내보내서 비즈니스 사용자에게 이메일로 보냈습니다. 이 방식은 안전하지도, 확장 가능하지도, 간단하지도 않습니다.

유니티 카탈로그와 데이터브릭스 데이터 웨어하우징 솔루션인 데이터브릭스 SQL은 BI 시각화와 데이터 공유 기능인 델타 쉐어링(Delta Sharing)을 통해 금융 서비스 조직이 데이터와 인사이트를 '민주화'하고 데이터 사용자 뿐 아니라 조직 내 모든 사람이 데이터에 액세스할 수 있도록 지원합니다. 복제 없이 모든 데이터를 안전하게 실시간으로 공유하는 개방형 프로토콜인 델타 쉐어링은 중앙 집중식 거버넌스와 크로스 플랫폼 수신자에 공유하는 등의 기능을 제공합니다.

금융 서비스를 위한 데이터브릭스 Lakehouse

금융 서비스를 위한 데이터브릭스 레이크하우스의 근간은 데이터와 사용자 통합, 실행 가능한 의사 결정, 데이터 민주화를 결합하는 것입니다. 이는 보안과 거버넌스를 희생하지 않으면서 데이터 액세스를 궁극적으로 민주화하는 것입니다.

Databricks Lakehouse for Credit Decisioning

비즈니스 결과

신용 의사 결정을 위한 레이크하우스 데모 투어를 시작하면서, 우리는 모든 금융 기관이 달성할 수 있는 영향력을 보여드리고자 합니다. 데이터를 통합하고 분석에 사용할 수 있게 함으로써 새로운 고객을 유치하는 비즈니스 성과를 창출하여 금융기관과 잠재 고객 모두에게 이익이 될 것입니다.

은행 이용이 저조한 고객에게 업셀링 및 서비스 제공

Databricks SQL dashboard showing how to Serve and Upsell Underbanked customers

고객 생애 가치 모델(CLV)을 적용한 대시보드 기능을 통해 신용 상품 이용이 저조한 고객(underbanked 고객)을 식별하고 서비스를 제공함으로써 얻을 수 있는 재무적 이점을 쉽게 보고할 수 있습니다. 이 대시보드는 원시 데이터, 머신러닝 예측, 설명 가능성 정보를 결합하여 각 금융 소외 고객의 채무 불이행 확률뿐만 아니라 각 고객 고유의 상위 3가지 이유도 파악할 수 있어 신용도를 평가하는 신용 상담원과 고객과 소통하는 마케팅 팀이 매우 유용하게 활용할 수 있습니다. 마지막으로, 아래에서 보고된 바와 같이 신용 점수 모델의 공정성을 평가하고 어떤 고객 그룹에게도 불이익이 돌아가지 않도록 하는 방법도 제공합니다.

Making sure all customers are fairly and accurately assessed for credit instruments.

Part II - Lakehouse 아키텍처를 이용하여 더 많은 고객에게 서비스를 제공하는 방법

플랫폼 구축

이 섹션에서는 신용 의사 결정 데모의 기술적 구현과 아키텍처에 대해 자세히 알아보고, 금융 조직이 데이터를 사용하여 비즈니스 목표를 달성하는 데 레이크하우스가 어떻게 도움이 되는지 살펴봅니다.

Credit Decisioning on the Lakehouse - Reference Architecture

위 그림은 신용 의사 결정 솔루션의 실제 아키텍처를 보여주며 데이터 통합, 거버넌스, 데이터 민주화 등 앞서 언급한 목표를 달성하는 방법을 보여줍니다.

데이터 수집부터 시작하여, 다양한 소스(아래)에 연결하고 단일 원본 데이터(Single source of truth) 위치로 수집하기 위해 델타 라이브 테이블(DLT)을 사용합니다. DLT는 자동화된 데이터 품질 검사 및 보고서, 자동 확장, 스키마 탐지, 실행 스케줄링, 심층 모니터링 및 통합 가시성 등 사용하기 매우 쉬운 데이터 엔지니어링 도구로 여러 가지 다른 기능을 갖추고 있습니다. DLT를 사용하면 수집된 데이터를 실버 및 골드 레이어로 쉽게 정리하고 큐레이팅할 수 있습니다.
데이터 엔지니어링 팀은 ETL 프로세스를 구축하기 위해 다양한 도구, 언어, 플랫폼 또는 서비스를 더 이상 사용할 필요가 없습니다. 정형, 비정형, 스트림 형태 등 모든 데이터 소스의 수집과 변환을 처리하는 데 필요한 것은 Python 또는 SQL 뿐입니다. 이러한 방식으로 DLT는 데이터 아키텍처를 크게 간소화하고, 필요한 시간과 노력을 줄이며, 데이터 품질 문제를 최소화하고, 전반적으로 데이터 팀이 조직의 데이터 목표를 향해 더 효과적으로 작업할 수 있도록 지원합니다.
다음 단계는 데이터를 적절히 보호하는 동시에 검색과 사용이 가능하도록 만드는 것입니다. 레이크하우스를 사용하면 모든 사용자와 데이터에 대한 세분화된 거버넌스를 쉽게 달성할 수 있습니다. 기존에는 데이터가 여러 위치와 형식에 분산되어 있어 데이터 거버넌스와 보안을 통합하기가 어려웠습니다. 레이크하우스에서는 모든 데이터가 단일 위치와 단일 형식(비정형, 정형, 스트림 등)에 있으므로 전반적인 거버넌스를 훨씬 더 쉽게 달성할 수 있습니다.
예를 들어, 아래 그림에서 간단한 SQL 문을 사용하여 민감한 데이터에 행 수준 마스킹을 구현하는 것이 얼마나 간단한지 확인할 수 있습니다. 이 시나리오에서는 '데이터 과학자' 그룹의 사용자가 은행 고객의 실제 이름을 볼 수 없도록 하기 위해 열을 마스킹합니다. 반면에 다른 모든 사용자는 고객 이름을 볼 수 있습니다.
이제 필요한 모든 데이터를 수집, 정리하고 적절하게 보안 및 관리했으므로 탐색적 데이터 분석(EDA) 및 피처 엔지니어링으로 이동할 수 있습니다. 머신러닝 피처(feature)들을 데이터브릭스 Feature Store에 저장하여, 중앙 집중형 피처 레포지토리를 구축하고, 피처들을 공유하며, 피처 값을 계산하는 데 사용된 것과 동일한 코드가 모델 학습 및 추론에 사용되도록 할 수 있습니다. 또한 데이터브릭스 Feature Store는 델타 테이블 위에 구축되므로 피처 셋에 대해 동일한 수준의 품질, 검색 가능성 및 거버넌스를 달성할 수 있습니다.

아래 그림에서 데이터브릭스 노트북의 자동화된 대시보드 기능을 볼 수 있습니다. 이 기능은 자동화된 데이터 프로파일링, 여러 사람이 동일한 노트북에서 서로 다른 언어(SQL 및 파이썬)로 작업할 수 있는 기능, 전체 CI/CD를 위한 임베디드 리포지토리 기능과 함께 레이크하우스에서 팀 간 협업을 매우 빠르게 만들어 줍니다. 피처 엔지니어링과 모델 훈련을 통해 빠르게 실험할 수 있는 능력은 고품질의 머신 러닝 모델을 생성하는 데 있어 핵심입니다.
일단 feature들이 생성되면, 데이터브릭스의 '유리상자' AutoML 기능을 사용하여 자동화된 모델 선택과 하이퍼파라미터 튜닝을 통해 기준 모델을 구축할 수 있습니다. MLFlow를 사용하면 수백 개의 모델을 쉽게 비교하고, 수십 개의 메트릭(아래 그림 참조)을 기반으로 모델을 평가하고, MLOps 모범 사례를 사용하여 배치 및 실시간 추론을 위한 모델을 신속하게 배포하고, 이러한 모델에서 데이터 및 개념의 편차를 모니터링하고, A/B 테스트 배포까지 수행할 수 있습니다.

이 솔루션의 일괄 추론은 은행 상품 사용이 적은 고객의 신용도를 예측하고 현재 채무 보유자의 채무 불이행 확률(및 채무 불이행에 따른 손실)을 예측하는 데 사용됩니다. 실시간 추론은 선구매 후상환 사용 사례에서 사용됩니다. 즉, 고객이 금융 거래에 필요한 금액이 없고, 은행이 거래를 완료하기 위해 고객의 신용 한도를 일시적으로 늘릴 수 있는지 여부를 실시간으로 계산하고자 하는 경우입니다.
다음 단계는 Databricks SQL을 사용하여 모든 데이터와 머신 러닝 예측을 함께 시각화하는 것입니다. 이미 블로그의 비즈니스 성과 섹션에서 레이크하우스에 구축된 몇 가지 대시보드를 보았습니다.
위에서 언급했듯이, 신용 결정이나 채무 불이행 예측의 최종 사용자는 데이터 과학자와 엔지니어가 아니라 비즈니스 사용자이기 때문에 데이터 팀뿐만 아니라 현업팀과 비즈니스 사용자도 필요한 데이터에 액세스할 수 있도록 지원하는 것이 중요합니다. 그러나 후자는 이러한 정보에 적시에 체계적으로 액세스할 수 없는 경우가 많습니다. 델타 쉐어링(Delta Sharing)을 통해 금융 기관은 데이터브릭스 사용자가 아니더라도 모든 수신자에게 데이터를 안전하게 공유할 수 있습니다.
데이터 수집, ELT, 머신 러닝 훈련 및 배포, 데이터 공유 및 대시보드 기능들을 단일한 데이터 파이프라인으로 프로덕션 환경에 구축하기 위해 데이터브릭스 워크플로우(Databricks Workflows)를 사용합니다. 워크플로우는 다양한 데이터 자산들을 이용하여 견고한 파이프라인을 생성합니다. Databricks 노트북, DBSQL 대시보드, DLT 파이프라인 또는 파이썬 파일 등 모든 것이 통합된 워크플로우에서 함께 작동할 수 있습니다.
마지막으로, 유니티 카탈로그가 자동으로 캡처하는 통합 데이터 계보(lineage)를 사용해 보겠습니다(아래 그림 참조). 동일한 계보 그래프에서 DLT를 통해 수집 및 정리된 데이터, 피처 스토어에 저장된 피처 세트, 머신러닝 모델을 학습한 후 MLFlow에서 생성한 배치 예측을 포함한 모든 데이터 자산을 한 눈에 볼 수 있습니다.

이러한 end-to-end 데이터 계보는 데이터의 규정 준수, 감사, 통합 가시성 및 검색 가능성을 이해하는 데 매우 중요합니다.

전체 데이터 계보가 매우 중요해지는 일반적인 시나리오로 다음 세가지가 있습니다:

설명 가능성 - 머신 러닝에 사용된 기능을 해당 기능을 생성한 원시 데이터까지 추적할 수 있는 수단이 있어야 합니다,
누락값 찾기 - 대시보드 또는 ML 모델에서 누락된 값을 원천 데이터까지 추적할 수 있어야 합니다,
특정 데이터 찾기 - 조직에는 수백, 수천 개의 데이터 테이블과 소스가 있습니다. 적절한 검색 도구가 없으면 특정 정보가 포함된 테이블이나 열을 찾는 것이 어려울 수 있습니다.

결론

지난 20년 동안 고객이 가장 열광한 발명품들은 더 향상된 자동화를 가져왔습니다. iPhone은 수동 하드웨어 업그레이드에 의존하는 대신 멀티터치를 감지하는 소프트웨어를 도입했습니다. PayPal은 P2P 네트워크를 활용하여 결제에 혁명을 일으켰습니다. 그리고 GPT-3는 업무 외 일상 생활에 스며든 정교한 텍스트 생성을 자동화하여 세상을 변화시켰습니다. 궁극적으로 신용 의사 결정도 동일한 수준의 혁신과 자동화의 혜택을 받고 있습니다. 이제 모든 기업(은행과 다른 금융기관)은 불완전한 데이터에 의존해 수동으로 대출을 승인하는 대신 대체 데이터 소스를 자동으로 수집하고, PII를 관리하여 가치 실현 시간을 개선하고, ML과 AI를 사용하여 신용 결정을 자동화함으로써 새로운 개인에게 신용을 제공할 수 있습니다. 데이터브릭스 레이크하우스의 신용 의사 결정 프레임워크는 데이터브릭스에서 제공하는 소프트웨어를 통해 이 자동화 프레임워크의 단순성을 정확히 코드화하도록 설계되었습니다.

비즈니스를 위한 신용 데이터 플랫폼을 시작하고 구축하려면 dbdemos.ai 의 데모를 방문하고 더 자세한 정보를 얻을 수 있습니다.

데이터브릭스 Lakehouse 기반으로 신용 데이터 플랫폼 구축하기

서론

신용 확장 - 잘 하는 것과 좋은 일을 하는 것은 모순되지 않습니다