특정 부서 또는 사용자 그룹에 맞춰 집계 및 필터링된 데이터를 포함하는 데이터 웨어하우스의 특정 하위 집합으로, 타겟팅된 분석을 가능하게 합니다.
작성자: Databricks 직원
데이터 마트는 하나의 데이터 팀, 커뮤니티 또는 사업부(예: 마케팅 또는 엔지니어링 부서)에 따른 특정 요구 사항을 충족하도록 설계된 테이블 세트가 포함된 큐레이션 데이터베이스입니다. 빅 데이터 시대가 도래해 데이터 분석의 중요성이 점점 더 커져가고 있는 지금, 정보를 효율적으로 관리하고 활용하는 데 꼭 필요합니다. 보통, 데이터 웨어하우스보다 작고 집중적이며 일반적으로 조직의 대규모 엔터프라이즈 데이터 웨어하우스의 하위 집합으로 존재하며 분석, 비즈니스 인텔리전스 및 보고에 주로 사용됩니다. 데이터 마트는 중앙 데이터 웨어하우스 및 데이터 레이크의 실질적인 첫 번째 진화 단계였습니다. ACNielsen은 1970년대 초 고객에게 디지털 형식으로 정보를 저장하고 영업을 강화할 수 있는 방법을 제공하는 최초의 데이터 마트를 소개했습니다.
오늘날 데이터 마트에는 다음과 같은 세 가지 기본 유형이 있습니다.
엔터프라이즈 데이터 웨어하우스는 기업의 모든 데이터 관리 요구 사항을 충족하기 위해 만들어졌습니다. 그러나 사업부마다 데이터 요구 사항과 목표가 다르기 때문에 늘 그렇듯 모두를 만족시키기는 어렵습니다. 따라서 각 부서는 셀프 서비스 분석 및 부서별 보고 요구를 충족하기 위해, 특정 데이터 웨어하우스의 주제 영역을 보완하는 자체 데이터 마트를 복사하거나 생성하게 됩니다. 경우에 따라 엔터프라이즈 IT 팀의 지원이 필요할 수 있습니다. 결과적으로 시간이 지남에 따라 데이터 마트는 엔터프라이즈 관점에서 데이터 사일로 및 데이터의 섀도 복사본이 될 수 있지만 부서 관점에서는 요구 사항을 충족합니다. 많은 부서가 이 작업을 수행 할 때 다양한 버전의 소스를 사용합니다.
레이크하우스는 통합 보안 및 거버넌스를 통해 모든 엔터프라이즈 데이터 웨어하우스 및 데이터 마트를 하나의 플랫폼에 배치하여 위에서 언급한 문제를 해결하는 동시에 서로 다른 팀에게 자체 샌드박스를 보유할 수 있는 유연성을 제공합니다. 모든 데이터 마트 또는 "보강된 사본"은 다른 모든 소스와 동일한 레이크하우스 플랫폼에서 만들어지기 때문에 레이크하우스의 데이터 카탈로그는 이를 발견하고, 태그 지정 및 데이터 사전 사용 등과 같은 데이터 거버넌스 규칙에 따라 모든 사람이 보강된 사본을 검색할 수 있도록 하여 유사한 중복 사본을 방지합니다.
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.