Unity Catalog는 어느 클라우드에서나 레이크하우스에 저장된 파일, 테이블, 머신 러닝 모델, 대시보드 등의 모든 데이터 및 AI 자산을 관리하는 통합 거버넌스 솔루션입니다.
데이터 및 AI를 위한 중앙 집중형 거버넌스
기본 내장된 데이터 검색 및 탐색 기능
성능 및 확장
모든 워크로드에 대한 자동 리니지
기존 도구와 통합

How it works
모든 데이터 자산을 한 곳에서 관리 및 통제
개방적 표준 ANSI SQL에 기반한 공통적인 거버넌스 모델을 사용하여 모든 클라우드에서 파일, 테이블, 대시보드, ML 모델의 거버넌스를 단순화해 보세요. 계정 수준에서 액세스 정책을 한 번에 정의하고 모든 워크로드와 워크스페이스에 적용할 수 있습니다. 또한, Unity Catalog는 데이터에 대해 수행한 작업의 감사 로그를 캡처하여 세분화된 감사를 한 곳에서 제공하며, 고객이 규정을 준수하고 요구 사항을 감사하도록 돕습니다.
세분화된 액세스 제어 기능 관리
표준 SQL 함수로 행 필터와 열 마스크를 정의함으로써, 행과 열에 대한 액세스 권한을 세분화하여 제어합니다. Databricks는 확장성과 통합을 개선하기 위한 기능을 꾸준히 개발하고 있으며, 곧 출시될 속성 기반 액세스 제어 기능을 통해 사용자 지정 태그(속성)에 따라 액세스 정책을 정의할 수 있게 될 것입니다.
안전한 통합 데이터 검색 경험
데이터 애널리스트, 데이터 엔지니어, 데이터 사이언티스트를 위한 통합 데이터 검색 경험으로 모든 데이터 자산에서 관련 데이터를 빠르게 찾아서 분석하고 참조하세요. Unity Catalog의 데이터 검색은 기본적으로 보안이 적용됩니다. 사용자의 액세스 권한에 따라 검색 결과가 제한되고 개인정보 보호를 고려하여 보안 계층을 추가합니다.
모든 규모에서 쿼리 성능 향상
Unity Catalog는 낮은 지연으로 메타데이터를 제공하고 테이블을 자동 튜닝하는 향상된 쿼리 성능을 제공하기 때문에 모든 규모에서 더욱 빠르게 쿼리가 실행됩니다. 비동기식 자동 데이터 치밀화로 파일 용량을 최적화하고, 백그라운드에서 입출력(I/O) 지연을 자동으로 단축합니다.
실시간 자동 데이터 리니지
SQL, Python, Scala 및 R 형식의 모든 워크로드에서 실시간 자동 데이터 리니지를 사용하여 레이크하우스에서의 데이터 흐름을 완전하게 확인할 수 있습니다. 데이터 품질 검사를 신속하게 실행하고, 데이터 변경 사항의 영향을 분석하며, 데이터 파이프라인에 있는 모든 오류를 디버깅해보세요. 테이블, 열, 노트북, 워크플로, 대시보드에서 모두 리니지를 활용할 수 있습니다. Unity Catalog의 리니지 그래프는 권한을 인식하여, 사용자의 액세스 권한에 따라 리니지 그래프의 액세스 권한을 제한합니다. 또한, REST API를 통해 리니지를 가져와서 다른 카탈로그와의 통합을 지원할 수도 있습니다.
안전한 조직 간 데이터 공유
Unity Catalog는 안전한 데이터 공유를 위한 세계 최초의 개방적 프로토콜인 Delta Sharing을 기본으로 지원함으로써, Delta Lake와 Apache Parquet 형식의 기존 데이터를 모든 컴퓨팅 플랫폼으로 간편하게 공유하도록 돕습니다. 고객이 Databricks 플랫폼을 사용하거나, 동일한 클라우드를 사용할 필요가 없고 심지어 클라우드를 이용하지 않아도 됩니다. 라이브 데이터를 복제하거나 다른 시스템으로 복사하지 않고도 공유가 가능합니다. Power BI, Tableau, Spark, pandas 및 Java와 기본적으로 통합되기 때문에 데이터를 받는 쪽에서 원하는 도구로 바로 공유된 데이터를 사용할 수 있습니다. 단일 플랫폼 한 곳에서 공유된 데이터를 관리, 통제, 감사 및 추적할 수도 있습니다.
