주요 컨텐츠로 이동

크로스 클라우드 데이터 거버넌스의 일반 사용 가능성을 발표합니다

Unity Catalog를 사용하여 안전한 Azure Databricks 환경에서 모든 S3 데이터에 액세스하고 관리하십시오

Image of Databricks announcement for cross-cloud governance general availability.

Published: May 21, 2025

제품1분 이내 소요

Summary

  • Azure Databricks의 Unity 카탈로그는 이제 AWS S3 데이터에 직접 액세스를 지원하여, S3와 ADLS 모두에 걸쳐 액세스 제어, 정책, 감사를 통합할 수 있습니다.
  • 이제 팀들은 데이터를 이동하거나 복제할 필요 없이 Azure Databricks에서 직접 S3 데이터를 구성하고 조회할 수 있습니다.
  • 일반 사용 가능성 릴리스는 S3 외부 테이블, 볼륨, 그리고 Azure Databricks 내의 AWS IAM 기반 자격증명과 같은 읽기 전용 기능을 지원합니다.

AWS S3 데이터를 Azure Databricks에서 Unity Catalog 를 통해 접근할 수 있는 기능이 일반적으로 사용 가능해졌다는 사실을 발표 하게 되어 기쁩니다. 모든 데이터와 AI 자산에 대한 업계 유일의 통합된 오픈 거버넌스 솔루션인 Unity Catalog는 조직이 어디에서든 데이터를 관리할 수 있게 해주어 보안, 준수, 클라우드 간 상호 운용성을 보장합니다. 이번 릴리스를 통해 팀은 데이터 세트를 이동하거나 복사할 필요 없이 Azure Databricks에서 AWS S3 데이터를 직접 구성하고 쿼리할 수 있게 되었습니다. 이로써 ADLS와 S3 저장소 모두에 걸쳐 정책, 접근 제어, 감사를 표준화하는 것이 더욱 쉬워졌습니다. 

이 블로그에서는 두 가지 주요 주제를 다룰 예정입니다:

  • Unity 카탈로그가 크로스 클라우드 데이터 거버넌스를 가능하게 하는 방법
  • Azure Databricks에서 AWS S3 데이터에 어떻게 액세스하고 작업하는지

Unity Catalog에서의 크로스 클라우드 데이터 거버넌스란 무엇인가요? 

기업들이 하이브리드 및 크로스 클라우드 아키텍처를 채택함에 따라, 종종 접근 제어가 파편화되고, 보안 정책이 일관성이 없으며, 거버넌스 프로세스가 중복됩니다. 이러한 복잡성은 위험을 증가시키고, 운영 비용을 높이며, 혁신을 늦춥니다.

Unity Catalog를 이용한 크로스 클라우드 데이터 관리는 단일 권한 모델, 중앙 집중식 정책 강제, 그리고 AWS S3와 Azure Data Lake Storage와 같은 여러 클라우드에 저장된 데이터에 대한 종합적인 감사를 확장함으로써 이를 단순화합니다. 이 모든 것은 Databricks Platform 내에서 관리됩니다.

Unity Catalog에서 크로스 클라우드 데이터 관리를 활용하는 주요 이점은 다음과 같습니다:

  • 통합 거버넌스 - 한 곳에서 액세스 정책, 보안 제어, 그리고 준수 표준을 관리하여 분리된 시스템을 다루는 것을 피하세요
  • 마찰 없는 데이터 접근 – 클라우드 간에 데이터를 안전하게 발견하고, 쿼리하고, 분석하는 단일 작업 공간에서, 실로를 제거하고 복잡성을 줄입니다
  • 강화된 보안 및 준수 - 모든 클라우드 저장소에 대한 중앙 집중식 가시성, 태깅, 계보, 데이터 분류, 감사를 향상시킵니다

클라우드 간 거버넌스를 연결함으로써, Unity Catalog는 팀이 그들의 모든 데이터와 AI 자산의 가치를 극대화하고 관리할 수 있는 단일하고 안전한 인터페이스를 제공합니다—그들이 어디에 있든간에.

작동 방식

이전에는 Azure Databricks를 사용할 때, Unity Catalog는 ADLS 내의 저장 위치만 지원했습니다. 이는 AWS S3 버킷에 데이터를 저장하고 있지만 Azure Databricks의 Unity Catalog로 접근하고 처리해야 하는 경우, 전통적인 접근 방식은 그 데이터를 ADLS 컨테이너로 추출, 변환, 로드(ETL)하는 과정을 필요로 했음을 의미합니다—이는 비용이 많이 들고 시간이 많이 소요되는 과정입니다. 이는 또한 중복되거나 오래된 데이터 복사본을 유지하는 위험을 증가시킵니다.

이번 GA 릴리스를 통해 이제 Azure Databricks의 Unity Catalog에서 외부 크로스 클라우드 S3 위치를 직접 설정할 수 있습니다. 이를 통해 마이그레이션 또는 중복 없이 S3 데이터를 원활하게 읽고 관리할 수 있습니다. 

크로스 클라우드 데이터 거버넌스 다이어그램

몇 가지 간단한 단계로 AWS S3 버킷에 대한 액세스를 구성할 수 있습니다: 

  1. 저장소 자격 증명을 설정하고 외부 위치를 생성합니다. AWS IAM 및 S3 리소스가 프로비저닝되면, Azure Databricks Catalog Explorer에서 직접 저장소 자격 증명 및 외부 위치를 생성할 수 있습니다. 
    • 저장소 자격 증명을 생성하려면, Credentials 를 카탈로그 탐색기 내에서 선택합니다. AWS IAM 역할 (읽기 전용)을 선택하고, 필요한 필드를 작성하고, 요청 시 신뢰 정책 스니펫을 추가합니다.새로운 인증 UI 생성
    • 외부 위치를 생성하려면, 외부 위치 Catalog Explorer 내에서 이동합니다. 그런 다음, 방금 설정한 자격증명을 선택하고 나머지 세부 정보를 완성합니다. Databricks 노트북에서 이미지 파일을 보여주는 스크린샷입니다.
  2. 권한 적용. Catalog Explorer의 자격증명 페이지에서 이제 Azure Databricks에서 ADLS와 S3 데이터를 한 곳에서 함께 볼 수 있습니다. 거기에서 두 저장 시스템에 대해 일관된 권한을 적용할 수 있습니다.
권한 부여를 적용하는 GIF 이미지

3. 쿼리 시작! Azure Databricks 작업 공간에서 직접 S3 데이터를 쿼리할 준비가 되었습니다.

데이터 시각화를 보여주는 Databricks 노트북 인터페이스의 이미지.

GA 릴리스에서 지원되는 것은 무엇인가요?

GA를 통해 이제 Azure Databricks에서 S3의 외부 테이블과 볼륨에 액세스하는 것을 지원합니다. 구체적으로, 다음 기능들이 이제 읽기 전용 용량으로 지원됩니다:

  • AWS IAM 역할 저장 자격증명
  • S3 외부 위치
  • S3 외부 테이블
  • S3 외부 볼륨
  • S3 dbutils.fs 접근
  • Azure에서의 UC의 S3 데이터 델타 공유

시작하기

Azure Databricks에서 크로스 클라우드 데이터 거버넌스를 시도해 보려면,IAM 역할을 위한 저장소 자격 증명 설정 방법 에 대한 문서를 확인해 보세요. Azure Databricks에서 S3 저장소를 위한 것입니다. 클라우드 제공자가 그들의 클라우드 서비스 외부에서 데이터에 접근하는 데 대한 요금을 부과할 수 있다는 점을 주의해야 합니다. Unity Catalog를 시작하려면, Azure 를 위한 Unity Catalog 가이드를 따르세요.

6월 9일부터 12일까지 샌프란시스코의 Moscone Center에서 열리는 Data + AI Summit에서 Unity Catalog 제품 및 엔지니어링 팀에 참여하세요! 데이터 및 AI 관리의 최신 혁신을 첫 눈에 보실 수 있습니다. 지금 등록하여 자리를 확보하세요!

 

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요