UC 외부 테이블에서 UC 관리형 테이블로 전환하여 쿼리 속도를 높이고 비용을 절감하세요
작성자: 엘리자베스 보먼 , Amit Vaswani
• Unity Catalog(UC) 외부 테이블을 UC 관리형 테이블로 원활하게 전환하여 다운타임을 최소화하고 테이블 구성 및 기록을 보존하는 방법을 알아보세요.
• Unity Catalog 관리형 테이블을 사용하여 쿼리 성능을 20배 향상하고 비용을 50% 이상 절감하며 고급 기능을 활용하세요.
• 데이터의 물리적 위치를 제어하고, 대량 전환을 수행하고, 롤백을 처리하고, 여정을 계획하는 방법을 알아보세요.
새로운 SET MANAGED 명령은 원활한 메커니즘을 제공하여 UC 외부 테이블을 UC 관리 테이블로 변환합니다. 이 과정에서 다운타임을 최소화하고 동시 쓰기를 처리하며 테이블 구성을 유지하고, 가능한 경우 테이블 기록을 보존합니다. 이 문서는 일반적으로 사용 가능한(GA) 명령을 사용하는 모범 사례와 단계별 가이드를 공유합니다.
Unity Catalog를 진실 공급원으로 사용하면 관리 테이블은 성능, 거버넌스 및 사용 편의성을 향상시키는 고유한 기능을 제공하며, 상호 운용성과 이식성을 유지합니다.
주요 이점은 다음과 같습니다.
SET MANAGED 명령은 외부 테이블을 관리 테이블로 변환하는 것을 더 쉽게 만듭니다.
기능 | SET MANAGED 명령의 이점 |
|---|---|
다운타임 최소화 | Databricks Runtime 16.1 이상을 사용하여 테이블을 온라인 상태로 유지하고 읽기 가능하게 하며, 쓰기 다운타임을 몇 분으로 최소화합니다(또는 Databricks Runtime 15.4 이하에서는 읽기 다운타임). 다운타임. |
ID 보존 | 테이블 이름, 권한, 태그 및 모든 테이블 설정, 테이블 기록(Delta 테이블의 경우)이 모두 유지됩니다. |
동시성 처리 | SET MANAGED 명령은 변환 중에 발생할 수 있는 동시 쓰기를 안전하게 처리합니다. |
안전 장치로서의 "실행 취소" | UNSET MANAGED라는 다른 명령을 사용하면 안전망으로 14일 이내에 변환된 테이블을 UC 외부로 롤백할 수 있습니다. |
SET MANAGED 명령은 테이블 변환을 간단하게 만듭니다. 단계별 가이드에서는 외부 테이블에서 관리 테이블로 원활하게 전환할 수 있도록 주요 팁을 간략하게 설명했습니다.
먼저 Unity Catalog 외부 테이블 몇 개를 UC 관리 테이블로 변환하여 팀이 프로세스, 사전 요구 사항 및 변환 후 단계를 숙지하도록 하세요.
예를 들어, Databricks 클라이언트에서만 읽고 쓰는 몇 개의 테이블에서 이 명령을 먼저 사용해 볼 수 있습니다(아래 "단계적 여정 계획" 섹션 참조).
테이블 읽기 및 쓰기 프로그램의 생태계가 변경 준비가 되었는지 확인하세요. 선택한 각 UC 외부 테이블 및 관련 워크로드에 대해 다음을 수행해야 합니다.
다음 변환 명령을 사용하여 변환을 실행합니다.
참고: UniForm이 활성화된 테이블의 경우 SET MANAGED TRUNCATE UNIFORM HISTORY를 사용합니다.
명령이 완료된 후 테이블 메타데이터를 확인하여 변환이 성공했는지 확인합니다.
이 명령의 출력에서 “Type” 속성이 이제 “MANAGED”로 표시되어야 합니다. Catalog Explorer의 “테이블 정보” 섹션에서도 동일한 정보를 볼 수 있습니다.

변환이 성공적으로 완료된 후 다음 최종 단계를 완료하여 원활한 전환을 보장합니다.
모든 테이블을 UC 관리형으로 성공적으로 전환하는 것은 여정입니다. 단계적 접근 방식을 채택하고 미리 계획하면 원활한 전환을 보장하는 데 도움이 될 수 있습니다.
변환 명령에 관한 다음 세부 정보는 미리 알아두면 유용할 수 있습니다.
특정 스키마 내에서 수백 또는 수천 개의 Unity Catalog 외부 테이블을 대량으로 변환하려면 다음 간단한 SQL 스크립트를 사용할 수 있습니다.
참고: 이 스크립트는 실시간 수정을 수행합니다. 프로덕션에서 실행하기 전에 개발 환경에서 철저히 테스트하는 것이 좋습니다.
Unified Catalog(UC) 관리형 테이블은 고객 관리 스토리지에 상주하며 개방형 카탈로그 API를 통해 액세스할 수 있습니다. 데이터가 물리적으로 저장되는 방식에 대한 더 많은 제어를 원하거나 데이터를 분리하려는 경우 카탈로그 또는 스키마 수준에서 관리형 스토리지 위치를 정의할 수 있습니다. 해당 카탈로그 또는 스키마에서 생성된 모든 새 관리형 테이블은 해당 지정된 위치에 자동으로 구성됩니다.
기존 외부 테이블의 경우 관리형 스토리지 위치를 설정한 다음 SET MANAGED 명령을 사용하여 UC 관리형 테이블로 변환할 수 있습니다. 변환 중에 시스템은 정의한 관리형 위치를 존중하여 클라우드 스토리지에서 데이터의 물리적 레이아웃을 제어할 수 있습니다. 지금 바로 비공개 미리 보기에서 이 기능을 사용하려면 계정 팀에 문의하십시오.
공개 미리 보기 이후 불과 몇 달 만에 수백 명의 고객이 SET MANAGED를 사용하여 수천 개의 테이블을 성공적으로 변환했습니다.
여기에 설명된 모든 내용은 이제 GA이므로 지금 바로 사용해보고 Unity Catalog 관리형 테이블의 성능, 거버넌스 및 단순성을 활용하십시오.
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.