Unity Catalog란? - 모든 데이터 자산에 적용되는 통합 거버넌스
학습할 내용
Unity Catalog는 Databricks 레이크하우스 환경에서 데이터와 AI 자산을 중앙에서 통합 관리하는 거버넌스 솔루션입니다. 이 플랫폼은 SQL, R, Python, Scala로 작성된 모든 워크로드에 대한 데이터 리니지를 자동으로 추적하여 데이터가 어떻게 생성되고 변환되며 활용되는지를 한눈에 파악할 수 있도록 지원합니다.
리니지는 테이블 및 열 수준까지 캡처되며, 몇 번의 클릭만으로 실시간으로 시각화됩니다. 또한 노트북, 워크플로, 대시보드와 같은 다양한 데이터 자산의 계보까지 추적해 전체 데이터 및 AI 워크플로에 대한 엔드투엔드 가시성을 제공합니다.
더불어 REST API를 통해 리니지 정보를 외부 시스템과 연동할 수 있어, 다른 데이터 카탈로그 및 거버넌스 도구와의 통합도 원활하게 지원합니다.


