데이터 가상화: 여러 데이터 소스에 대한 통합된 실시간 액세스
데이터 가상화란 무엇인가요?
데이터 가상화는 조직이 데이터를 물리적으로 이동하거나 복사하지 않고도 여러 데이터 소스의 정보를 통합된 뷰로 생성할 수 있게 해주는 데이터 통합 방법입니다. 핵심 데이터 가상화 기술인 이 데이터 관리 접근 방식은 데이터 소비자가 단일 가상 레이어를 통해 이기종 시스템의 데이터에 액세스할 수 있도록 합니다. 중앙 리포지토리로 데이터를 추출하는 대신, 데이터 가상화는 데이터 소비자와 소스 시스템 사이에 추상 레이어를 배치합니다. 사용자는 단일 인터페이스를 통해 이 레이어에 쿼리하며, 기본 데이터는 원래 위치에 그대로 유지됩니다.
데이터 가상화는 최신 데이터 관리의 근본적인 과제를 해결합니다. 즉, 엔터프라이즈 데이터가 데이터베이스, 데이터 레이크, 클라우드 애플리케이션 및 레거시 시스템을 포함한 여러 소스에 분산되어 있다는 점입니다. 기존의 데이터 통합 접근 방식은 분석을 시작하기 전에 데이터를 중앙 웨어하우스로 이동시키기 위해 복잡한 파이프라인을 구축해야 합니다. 데이터 가상화는 정보가 있는 곳이면 어디든 실시간 액세스를 제공하여 이러한 지연을 없애줍니다.
조직이 멀티 클라우드 환경, lakehouse 아키텍처, 조직 간 Data Sharing을 채택함에 따라 데이터 가상화에 대한 관심이 높아졌습니다. 이러한 추세로 인해 팀이 액세스해야 하는 소스의 수가 늘어나면서 물리적 통합은 점점 더 비현실적이 되고 있습니다. 데이터 가상화는 스토리지를 통합하지 않고 액세스를 통합하는 방법을 제공합니다.
자세히 보기
데이터 가상화 기술은 데이터 소비자와 소스 시스템 사이에 위치하는 가상화 계층을 만듭니다. 이 가상 계층을 통해 비즈니스 사용자는 각 소스의 기술적 복잡성을 이해하지 않고도 데이터 레이크, 데이터 웨어하우스 및 클라우드 스토리지 서비스 전반의 데이터를 쿼리할 수 있습니다. 데이터 가상화를 구현함으로써 조직은 팀이 중앙 집중식 거버넌스를 유지하면서 여러 소스의 데이터를 실시간으로 결합할 수 있도록 합니다.
명확히 해야 할 중요한 혼동 지점이 하나 있습니다. 데이터 가상화와 데이터 시각화는 비슷하게 들리지만 전혀 다른 문제를 해결합니다. 데이터 가상화는 분산된 소스 전반에 걸쳐 액세스 레이어를 생성하는 통합 기술입니다. 데이터 시각화는 비즈니스 인텔리전스를 위해 정보를 차트, 그래프 및 대시보드로 렌더링하는 프레젠테이션 기술입니다. 이 두 가지는 상호 보완적입니다. 데이터 가상화는 통합된 액세스를 제공하며, 시각화 도구는 이를 사람이 읽을 수 있는 형식으로 표시합니다.
애자일 데이터 관리를 추구하는 조직에게 데이터 가상화는 기존 접근 방식의 인프라 오버헤드 없이 더 빠른 인사이트 를 얻을 수 있는 경로를 제공합니다.

관련 링크: ETL 프로세스 및 데이터 통합 전략
데이터 가상화 작동 방식: 아키텍처 및 구성 요소
데이터 가상화 아키텍처는 비즈니스 정의를 위한 시맨틱 데이터 레이어, 쿼리 페더레이션을 위한 가상화 레이어, 거버넌스를 위한 메타데이터 관리라는 세 가지 핵심 데이터 관리 인프라 구성 요소에 의존합니다. 최신 플랫폼은 이러한 구성 요소를 통합하여 데이터 사이언티스트, 비즈니스 사용자 및 데이터 소비자가 정보 저장 위치를 몰라도 데이터 소스와 데이터 서비스에 액세스할 수 있는 완전한 가상 데이터 환경을 만듭니다.
가상화 레이어는 데이터 소비자(예: 애널리스트, 애플리케이션 및 BI 도구)와 기본 데이터 소스 사이에 위치합니다. 이 레이어는 데이터가 어디에 있는지, 어떻게 구조화되어 있는지, 어떻게 액세스하는지에 대한 메타데이터를 유지 관리합니다. 레이어 자체는 데이터를 저장하지 않으며, 지능형 라우팅 및 변환 엔진으로 작동합니다. Unity Catalog 와 같은 거버넌스 솔루션은 이 메타데이터를 중앙에서 관리하여 검색 및 액세스 정책에 대한 단일 제어 지점을 제공할 수 있습니다.
사용자가 쿼리를 제출하면 데이터 가상화 엔진은 어떤 데이터 소스에 관련 정보가 포함되어 있는지 확인합니다. 관계형 데이터베이스의 SQL, 클라우드 애플리케이션의 API 호출, 데이터 레이크의 파일 액세스 프로토콜 등 각 시스템의 고유 언어로 쿼리를 변환합니다. 그런 다음 엔진은 시스템 전반에 걸쳐 요청을 통합하고 결과를 조합하여 통합된 응답을 만듭니다.
데이터 가상화는 이러한 분산 실행 모델을 설명하는 쿼리 페더레이션을 가능하게 합니다. 복잡한 쿼리는 하위 쿼리로 분할되며, 각 하위 쿼리는 적절한 소스로 라우팅됩니다. 결과는 가상화 레이어로 반환되며, 가상화 레이어는 결과를 조인하고 변환한 후 사용자에게 단일 답변을 전달합니다. 예를 들어, Lakehouse Federation을 사용하면 데이터를 먼저 마이그레이션하지 않고도 레이크하우스에서 직접 외부 데이터베이스, warehouse 및 클라우드 애플리케이션에 대한 query를 실행할 수 있습니다. 성능 최적화는 필터링 로직이 중앙이 아닌 소스에서 실행되는 프레디케이트 푸시다운과 같은 기술을 통해 이루어집니다.

최신 플랫폼은 조인 푸시다운, 컬럼 프루닝 및 지능형 캐싱도 구현합니다. 소스의 응답 시간이 다른 경우, 엔진은 쿼리를 병렬로 실행하고 시간 초과 처리를 적용하여 느린 소스가 결과를 차단하는 것을 방지합니다. 이러한 최적화는 가상화된 쿼리가 물리적으로 통합된 데이터에 대한 쿼리 성능에 근접하도록 돕습니다.
레이크하우스 네이티브 데이터 가상화는 연합 데이터와 내부 데이터 모두에 대한 통합 거버넌스라는 추가적인 이점을 제공합니다. Unity Catalog가 액세스 정책을 관리하므로 조직은 외부 데이터베이스와 lakehouse 테이블에 동일한 보안 규칙을 적용합니다. 사용자는 별도의 시스템이나 권한을 관리하지 않고도 동일한 SQL 문에서 가상화된 데이터와 물리적 데이터를 쿼리합니다.
데이터 가상화와 ETL: 주요 차이점
기존의 추출, 변환, 로드(ETL)는 소스 시스템의 데이터를 중앙 집중식 웨어하우스나 레이크로 물리적으로 이동시킵니다. 이로 인해 사본이 생성되고 추출 주기 사이에 지연 시간이 발생하며 지속적인 파이프라인 유지 관리가 필요합니다. 데이터 가상화는 반대 접근 방식을 취합니다. 즉, 데이터는 제자리에 유지되며 필요에 따라 액세스됩니다.
각 접근 방식은 서로 다른 사용 사례를 처리합니다. 주요 차원에서 어떻게 다른지 살펴보세요.
데이터 이동: ETL은 데이터를 중앙 리포지토리로 복사합니다. 데이터 가상화는 중복을 생성하지 않고 데이터를 제자리에서 쿼리합니다.
데이터 최신성: ETL은 마지막 새로고침 주기만큼 최신 데이터를 제공하며, 이는 몇 시간 또는 며칠 전의 데이터일 수 있습니다. 데이터 가상화는 라이브 소스 데이터에 대한 실시간 액세스를 제공합니다.
인사이트 확보 시간: ETL은 분석을 시작하기 전에 파이프라인을 구축해야 하므로 종종 몇 주 또는 몇 달이 걸립니다. 데이터 가상화는 연결이 구성되면 즉시 액세스를 제공합니다.
복잡한 변환: ETL은 다단계 처리 및 기록 분석에 탁월합니다. 데이터 가상화는 조인과 필터를 처리하지만 정교한 변환 로직에는 어려움이 있습니다.
대부분의 조직에서는 두 가지 접근 방식을 함께 사용합니다. ETL과 ELT는 복잡한 변환, 기록 추세 및 성능에 중요한 배치 워크로드를 처리합니다. 데이터 가상화는 임시 분석 및 운영 대시보드를 위한 민첩한 실시간 액세스를 제공합니다. 선택은 이념보다는 워크로드 특성에 따라 달라집니다.
관련 링크:통합 거버넌스 및 데이터 아키텍처 패턴을 위한 Unity Catalog
주요 이점: 데이터 이동 없는 실시간 액세스
데이터 가상화의 비즈니스 사례는 속도, 비용 절감, 거버넌스 간소화에 중점을 둡니다. 데이터 가상화를 통해 조직은 스토리지 비용을 절감하고 비즈니스 사용자의 데이터 액세스를 개선하며 이기종 소스 전반의 인프라를 간소화할 수 있습니다.
1. 스토리지 및 인프라 비용 절감
데이터 가상화는 데이터 복제 비용을 절감하여 즉각적인 가치를 창출합니다. 중복을 제거하면 조직은 웨어하우스, 마트, 분석 환경 전반에 걸쳐 동일한 정보의 여러 복사본을 저장하는 데 드는 비용을 절감할 수 있습니다. 볼륨이 증가하고 팀이 동기화된 복사본을 유지하는 인프라 복잡성을 피하게 되면서 스토리지 절감 효과가 복합적으로 증가합니다.
2. 데이터 소비자를 위한 거의 실시간에 가까운 인사이트
쿼리는 오래된 웨어하우스 사본이 아닌 라이브 시스템에서 직접 실행됩니다. 예를 들어, 금융 서비스 회사는 이 기능을 사기 탐지에 사용하고, 소매업체는 거래가 발생할 때 여러 채널에 걸쳐 재고를 추적하며, 의료 시스템은 진료 중에 현재 환자 기록에 액세스할 수 있습니다. 스트리밍 파이프라인을 구축하지 않고도 실시간 분석이 가능해집니다.
3. 간소화된 인프라
데이터 가상화를 구현함으로써 조직은 여러 시스템에 거버넌스를 복제하는 대신 가 상 데이터 계층에서 액세스 규칙, 보안 정책 및 메타데이터를 중앙 집중화합니다. 관리자는 각 소스에서 정책을 별도로 유지 관리하는 대신 한 번만 정책을 정의합니다. 독립 실행형 인프라로 배포하는 대신 레이크하우스 플랫폼에 내장하면 팀은 또 다른 시스템을 관리할 필요가 없습니다.
4. 비즈니스 이니셔티브의 가치 창출 시간 단축
조직들은 제공 기간을 몇 주에서 며칠 또는 몇 시간으로 단축했다고 보고합니다. 이러한 가속화는 각각의 새로운 분석 사용 사례에 대해 ETL 파이프라인을 설계, 구축, 테스트 및 유지 관리하는 데 일반적으로 소요되는 몇 달의 시간을 없앤 데서 비롯됩니다.
이러한 이점은 다양한 데이터 소스, 빠르게 변화하는 요구사항, 그리고 과거 데이터의 깊이보다 데이터 최신성을 더 중시하는 시나리오에 가장 강력하게 적용됩니다.

통합 접근 방식 비교
ETL과 같은 기존 통합 방법은 데이터를 중앙 리포지토리로 물리적으로 이동시킵니다. 데이터 가상화는 데이터를 복제하지 않고 제자리에서 액세스하는 다른 접근 방식을 취합니다. 기업들은 복잡한 변환에는 ETL을, 민첩한 액세스에는 데이터 가상화를 사용하는 등 두 전략을 함께 사용하는 경우가 많습니다.
교차 링크: 실시간 분석 기능 및 최신 데이터 웨어하우징
실용적인 사용 사례 & 산업 응용 분야
데이터 가상화 기술은 조직이 운영 시스템, 데이터 레이크, 클라우드 애플리케이션 전반에 걸쳐 통합된 액세스를 필요로 할 때 탁월한 성능을 발휘합니다. 데이터 가상화는 기존 데이터 통합 프로젝트의 리드 타임 없이 여러 소스로부터의 실시간 액세스를 가능하게 합니다. 다음 예시는 일반적인 패턴을 보여줍니다.
리테일
소매업체는 이커머스 플랫폼, 실제 매장 시스템, 창고 관리 애플리케이션, POS(판매 시점 정보 관리) 단말기, 공급업체 네트워크 전반에서 운영됩니다. 데이터 가상화를 구현하면 포인트 투 포인트 통합을 구축하지 않고도 여러 시스템에 대한 액세스를 제공하여 엔드투엔드 공급망 가시성을 확보할 수 있습니다.
재고 관리는 특히 실시간 데이터 가상화의 이점을 누릴 수 있습니다. 소매업체는 매일 밤 재고 수를 배치 동기화하는 대신 모든 채널의 실시간 데이터를 쿼리하여 정확한 가용성을 제공합니다. 이는 고객이 주문하기 전에 현재 재고 정보가 필요한 '온라인 구매 후 매장 픽업'과 같은 기능을 지원합니다. 공급망 액세스를 위해 데이터 가상화를 구현하는 조직은 재고 유지 비용 감소와 수요 예측 정확도 향상을 통해 상당한 비용 절감 효과를 보고합니다.

금융 서비스
금융 서비스 회사는 데이터 가상화 솔루션을 사용하여 신용카드 거래, 예금, 대출 시스템, CRM 플랫폼 및 외부 공급업체의 고객 데 이터를 통합하여 포괄적인 고객 프로필을 구축합니다. 데이터 가상화는 업데이트 사이에 오래된 정보가 되는 사전 구축된 고객 레코드를 유지하는 대신 이러한 뷰를 온디맨드로 조합합니다.
실시간 사기 탐지에는 여러 계정의 거래 패턴에 대한 1초 미만의 액세스가 필요합니다. 배치 지향 웨어하우스는 이러한 지연 시간 요구 사항을 지원할 수 없습니다. 규정 준수에도 이점이 있습니다. 심사관 검토를 위한 감사 추적을 유지하면서 시스템 전반에 걸친 통합 보고가 가능해집니다.
의료 서비스
환자 데이터는 민감하며 전자 건강 기록, 청구 시스템, 영상 아카이브, 실험실 정보 시스템 전반에 분산되어 있습니다. 데이터 가상화를 통해 임상의는 데이터를 소스에 유지하면서 진료 중에 통합된 환자 뷰에 액세스할 수 있습니다. 환자의 기록을 검토하는 의사는 각 시스템이 독립적으로 데이터를 저장하더라도 단일 쿼리를 통해 1차 진료, 전문의 진료, 검사 결과 기록을 볼 수 있습니다.
이 아키텍처는 민감한 정보가 침해에 취약한 단일 위치에 집중되지 않기 때문에 개인정보 보호 요구 사항을 지원합니다. 병원과 의료 시스템은 조직 간에 데이터를 물리적으로 전송하지 않고도 액세스를 공유하여 협력 진료를 가능하게 할 수 있습니다.
데이터 가상화가 적합하지 않은 경우
데이터 가상화에는 명확한 한계가 있습니다. 대용량 배치 처리에는 여전히 물리적 이동이 필요하며, 수백만 개의 행을 처리하는 것은 데이터를 한 번 이동하는 것보다 성능상의 이점이 없습니다. 예를 들어 시간당 수백만 건의 트랜잭션을 처리하는 결제 처리업체는 해당 워크로드를 가상화해도 아무런 이점을 얻지 못할 것입니다. 데이터 가상화는 현재 데이터에만 액세스하므로 특정 시점 스냅샷이 필요한 과거 데이터 분석에는 시간 경과에 따른 상태를 기록하는 웨어하우스가 필요합니다. 복잡한 다단계 변환은 데이터베이스 스타일의 조인, 필터, 집계로 제한되는 기능을 초과합니다.
매우 큰 규모의 warehouse 구현, 데이터 센터 간 운영 및 보장된 낮은 지연 시간이 필요한 워크로드는 일반적으로 데이터 엔지니어링 파이프라인을 통한 물리적 데이터 이동이 필요합니다.
상호 링크: 데이터 레이크 및 비즈니스 인텔리전스 애플리케이션
거버넌스, 보안 및 품질 고려 사항
데이터 가상화는 중앙 집중식 가상화 레이어에서 제어를 통합하여 거버넌스를 강화합니다. 데이터 가상화 도구를 사용하면 관리자가 서로 다른 소스에서 개별적으로 보안 정책을 관리하는 대신 한 번에 정의할 수 있습니다.
최신 플랫폼의 보안 기능에는 역할 기반 액세스 제어, 행 수준 및 열 수준 보안, 민감한 필드에 대한 데이터 마스킹이 포함됩니다. 분류 태그에 연결된 속성 기반 액세스 제어를 사용하면 사용자가 데이터에 액세스하는 방식에 관계없이 정책이 데이터와 함께 이동할 수 있습니다. 애널리스트가 SQL query, REST APIs 또는 BI 도구를 통해 연결하든 동일한 보안 규칙이 적용됩니다.

감사 및 리니지 추적은 누가, 언제, 어떤 애플리케이션에서 어떤 데이 터에 액세스했는지 캡처합니다. Unity Catalog 는 규정 준수 보고를 위해 모든 언어에 걸쳐 사용자 수준 감사 로그와 리니지를 제공합니다. 이러한 가시성은 입증 가능한 거버넌스를 요구하는 GDPR, HIPAA, CCPA 및 금융 규정을 지원합니다.
쿼리가 라이브 소스에 도달하므로 데이터 최신성은 데이터 가상화의 고유한 특징입니다. 그러나 이는 데이터 품질에 대한 고려 사항을 제기합니다. 즉, 시스템에 오류나 불일치가 포함된 경우 데이터 가상화는 이러한 문제를 소비자에게 직접 노출합니다. 효과적인 구현을 위해서는 데이터 가상화와 데이터 품질 모니터링을 결합하여 통합된 뷰가 무결성을 유지하도록 해야 합니다.
시맨틱 일관성은 또 다른 과제입니다. 시스템마다 동일한 개념에 대해 다른 이름을 사용하거나, 동등한 필드에 대해 다른 데이터 유형을 사용하거나, 유사한 메트릭에 대해 다른 비즈니스 정의를 사용할 수 있습니다. 가상화 계층은 각 시스템이 데이터를 다르게 레이블 지정하고 형식을 지정하더라도 CRM의 고객 데이터가 청구 시스템의 동일한 고객과 일치하도록 일관된 명명 규칙을 적용해야 합니다. 일부 조직에서는 시맨틱 데이터 계층을 추가하여 모든 가상화된 소스에 적용되는 표준 비즈니스 용어와 계산을 정의함으로써 애널리스트가 데이터를 저장하는 기본 시스템에 관계없이 일관된 정의를 볼 수 있도록 합니다.
교차 링크: Unity Catalog를 사용한 데이터 거버넌스 및 데이터 관리 모범 사례
구현 모범 사례 및 도구 선택
데이터 가상화를 구현하는 조직은 성공적인 배포를 보장하기 위해 입증된 패턴을 따라야 합니다. 작게 시작하세요. 성공적인 구현은 종종 소규모 팀이 특정 고부가가치 프로젝트를 해결하는 것으로 시작하며, 이해관계자에게 가치를 입증한 후에만 확장합니다. 기술을 배포하기 전에 소유권, 보안 모델 및 개발 표준을 설정하여 거버넌스를 먼저 정의하세요. 성능을 정기적으로 모니터링하여 느리게 실행되는 쿼리를 식별하고, 자주 액세스하는 가상 뷰를 최적화하며, 사용 패턴이 변화함에 따라 연결을 조정하세요.
데이터 가상화의 실제 모습: 실제 구현 사례
구체적인 예를 들어보겠습니다. 한 소매 회사가 고객 생애 가치를 분석하려고 하지만 고객 데이터는 Salesforce CRM에 있고, 트랜잭션 기록은 PostgreSQL 데이터베이스에 있으며, 웹사이트 행동은 Google Analytics에, 반품 데이터는 레거시 Oracle 시스템에 남아 있습니다.
기존의 데이터 통합 방식에서는 이 모든 데이터를 추출, 변환하고 warehouse에 로드하기 위해 ETL 파이프라인을 구축해야 합니다. 해당 프로젝트는 몇 달이 걸립니다. 데이터 가상화를 사용하면 관리자가 각 소스에 연결을 생성하고 여러 시스템의 데이터를 결합하는 가상 뷰를 게시합니다. 애널리스트는 익숙한 SQL을 통해 이 뷰를 쿼리하거나 BI 도구를 직접 연결합니다. 분석가들은 하나의 통합된 스키마에서 모든 소스의 최신 데이터를 볼 수 있습니다. 나중에 회사가 자체 데이터베이스를 사용하는 모바일 앱을 추가할 경우, 웨어하우스를 재설계할 필요 없이 며칠 만에 해당 소스를 가상 뷰에 추가할 수 있습니다.
이 패턴은 또한 "먼저 가상화하고 나중에 마이그레이션하는" 전략을 지원합니다. 팀은 외부 소스로 쿼리를 연합 하는 것으로 시작한 다음, 어떤 데이터에 가장 자주 액세스하는지 모니터링합니다. 사용량이 많은 데이터세트는 Delta Lake로의 물리적 마이그레이션 후보가 되며, 여기서 쿼리 성능이 향상되고 스토리지 비용이 감소할 수 있습니다. 사용량이 적은 데이터는 가상화 상태로 유지되어 불필요한 마이그레이션 노력을 피할 수 있습니다.
데이터 가상화 소프트웨어 및 도구 평가하기
데이터 가상화 도구를 평가할 때는 세 가지 기준을 우선적으로 고려해야 합니다.
소스 다양성 지원: 플랫폼이 관계형 데이터베이스, 클라우드 애플리케이션, APIs 및 파일 기반 스토리지를 포함하여 현재 및 예상되는 모든 소스에 연결됩니까? 필요한 데이터 서비스를 지원하는지 고려하세요. 연결성의 격차는 데이터 가상화가 약속하는 통합 액세스를 저해하는 해결 방법을 강요합니다.
보안 기능: 행 수준 및 열 수준 보안, 마스킹, 암호화, 포괄적인 감사 로깅을 찾아보세요. 이러한 기능은 사용자가 가상화된 데이터에 액세스하는 방식에 관계없이 일관되게 적용되어야 합니다.
셀프 서비스 기능: 비즈니스 사용자가 모든 요청에 대해 IT 부서의 개입 없이 가상화된 데이터를 검색하고 액세스할 수 있습니까? 모든 새로운 쿼리에 관리자의 개입이 필요하다면 데이터 가상화의 가치는 떨어집니다.
이 세 가지 외에도 쿼리 성능 요구 사항, 배포 모델 선호도, 총소유비용(TCO)을 고려하세요.
관련 링크: 데이터 통합 및 시맨틱 레이어 기능을 위한 LakeFlow
결론: 데이터 가상화를 선택해야 하는 경우
데이터 가상화는 실시간 운영 분석, 다양한 소스에 대한 주기적인 탐색, 개념 증명(PoC) 개발 및 query 성능보다 데이터 최신성이 더 중요한 시나리오에 탁월합니다. 데이터 가상화는 조직이 복잡한 파이프라인 없이 여러 소스의 데이터에 액세스할 수 있도록 지원하는 반면, warehouse를 통한 기존 접근 방식은 복잡한 변환, 과거 동향 분석, 대용량 배치 처리 및 지연 시간에 민감한 분석 워크로드에 더 뛰어납니다.
문제는 어떤 접근 방식을 독점적으로 선택할 것인가가 아니라, 포괄적인 아키텍처 내에서 각 방식이 어디에 적합한가입니다. 조직들은 점점 더 두 기술을 모두 배포하고 있습니다. 즉, 애자일 액세스 및 실험을 위한 데이터 가상화와 워크로드 특성이 요구하는 경우의 물리적 통합입니다. "먼저 가상화하고 나중에 마이그레이션하는" 패턴을 통해 팀은 연합 쿼리를 통해 즉시 가치를 제공하는 동시에 실제 사용량 데이터를 사용하여 Delta Lake 또는 다른 레이크하우스 스토리지로의 물리적 마이그레이션 투자를 정당화할 소스의 우선순위를 정할 수 있습니다.
분산 데이터에 대한 실시간 액세스가 명확한 비즈니스 가치를 창출하는 사용 사례를 파악하는 것부터 시작하세요. 거기서 데이터 가상화를 파일럿 테스트하고, 결과를 측정하고, 입증된 성공을 기반으로 확장하세요.
관련 링크: ETL vs. ELT 의사결정 프레임워크


