Unity Catalog는 어느 클라우드에서나 레이크하우스에 저장된 파일, 테이블, 머신 러닝 모델, 대시보드 등의 모든 데이터 및 AI 자산을 관리하는 통합 거버넌스 솔루션입니다.
“Unity Catalog distills permissioning into its important pieces by removing the complexity introduced by IAM policies and other data control platforms, allowing us to focus on what is important to our business use case.”
— Joseph Kesting, Software Engineer

작동 방식

모든 데이터 자산을 한 곳에서 관리 및 통제
개방적 표준 ANSI SQL에 기반한 공통적인 거버넌스 모델을 사용하여 모든 클라우드에서 파일, 테이블, 대시보드, ML 모델의 거버넌스를 단순화해 보세요. 계정 수준에서 액세스 정책을 한 번에 정의하고 모든 워크로드와 워크스페이스에 적용할 수 있습니다. 또한, Unity Catalog는 데이터에 대해 수행한 작업의 감사 로그를 캡처하여 세분화된 감사를 한 곳에서 제공하며, 고객이 규정을 준수하고 요구 사항을 감사하도록 돕습니다.

세분화된 액세스 제어 기능 관리
표준 SQL 함수로 행 필터와 열 마스크를 정의함으로써, 행과 열에 대한 액세스 권한을 세분화하여 제어합니다. Databricks는 확장성과 통합을 개선하기 위한 기능을 꾸준히 개발하고 있으며, 곧 출시될 속성 기반 액세스 제어 기능을 통해 사용자 지정 태그(속성)에 따라 액세스 정책을 정의할 수 있게 될 것입니다.

안전한 통합 데이터 검색 경험
데이터 애널리스트, 데이터 엔지니어, 데이터 사이언티스트를 위한 통합 데이터 검색 경험으로 모든 데이터 자산에서 관련 데이터를 빠르게 찾아서 분석하고 참조하세요. Unity Catalog의 데이터 검색은 기본적으로 보안이 적용됩니다. 사용자의 액세스 권한에 따라 검색 결과가 제한되고 개인정보 보호를 고려하여 보안 계층을 추가합니다.

모든 규모에서 쿼리 성능 향상
Unity Catalog는 낮은 지연으로 메타데이터를 제공하고 테이블을 자동 튜닝하는 향상된 쿼리 성능을 제공하기 때문에 모든 규모에서 더욱 빠르게 쿼리가 실행됩니다. 비동기식 자동 데이터 치밀화로 파일 용량을 최적화하고, 백그라운드에서 입출력(I/O) 지연을 자동으로 단축합니다.

“Unity Catalog 덕분에 회사 전반적으로 데이터 관리와 액세스 제어를 단순화할 수 있었습니다. Compass 데이터 팀은 100개 이상의 데이터 소스를 안전하게 온보딩하고, Unity Catalog에 모든 워크스페이스를 마이그레이션하였으며, 주요 이해관계자들이 고객, 제품, 사용량, 수익 등의 분야에 대한 인사이트를 얻을 수 있는 골드 레이어를 개발함으로써 회사 전체에 완전한 액세스 관리 기능을 제공하는 단일 통합 출처를 구현했습니다.”

“Unity Catalog는 저희에게 혁신적 도구였습니다. 저희 애널리스트는 Databricks 워크스페이스에서 실시간으로 AWS 외부 테이블에 액 세스하고, Delta Lake 테이블과 조인할 수 있게 되었습니다. Glue 테이블을 마이그레이션하지 않고도 Databricks SQL이 제공하는 성능의 장점을 활용할 수 있습니다. Unity Catalog를 사용하고 나서는 데이터를 옮기지 않고도 여러 팀이 서로 협업할 수 있게 되었습니다.”
기존 도구와의 원활한 통합
Unity Catalog는 기존 데이터 카탈로그, 데이터 스토리지 시스템, 거버넌스 솔루션과 함께 작동하므로 값비싼 마이그레이션 비용 없이 기존 투자를 활용하고 미래 지향적인 거버넌스 모델을 구축할 수 있습니다.