Um subconjunto específico de um data warehouse com dados agregados e filtrados para departamentos ou grupos de usuários específicos, permitindo análises direcionadas.
Data mart é um banco de dados com curadoria que inclui um conjunto de tabelas projetadas para atender às necessidades específicas de uma única equipe de dados, comunidade ou linha de negócios, como o departamento de marketing ou engenharia. Normalmente, é menor e mais focado do que um data warehouse e, geralmente, existe como um subconjunto do maior data warehouse corporativo de uma organização. Os data marts são mais usados para análises, business intelligence e relatórios. Os data marts foram o primeiro passo evolutivo na realidade física dos data warehouses centrais e data lakes. A ACNielsen ofereceu aos clientes o primeiro data mart no início da década de 1970 como uma forma de armazenar informações digitalmente e aumentar os esforços de vendas.
Atualmente, existem três tipos básicos de data marts:
Os data warehouses corporativos são criados com boas intenções para atender a todas as necessidades de gerenciamento de dados de uma empresa. Mas não é possível agradar a todos, pois unidades de negócios diferentes têm necessidades e objetivos de dados diferentes. Assim, os departamentos copiam e criam seus próprios data marts (às vezes com a ajuda da TI corporativa) com o objetivo de ampliar a área temática de um data warehouse específico, para atender às suas necessidades de análise de autoatendimento e relatórios departamentais. Como resultado, com o tempo, os data marts podem se tornar silos de dados e cópias ocultas dos dados — do ponto de vista corporativo — mas atendem bem às necessidades do departamento. Quando muitos departamentos fazem isso, não existe uma versão única da verdade.
O lakehouse resolve os desafios mencionados acima colocando todos os data warehouses e data marts corporativos em uma única plataforma, com segurança e governança unificadas, ao mesmo tempo que oferece às diferentes equipes a flexibilidade de ter seus próprios sandboxes. Como qualquer data mart ou "cópia aumentada" é feita na mesma plataforma do lakehouse que todas as outras, o catálogo de dados do lakehouse descobre isso e, de acordo com as regras de governança de dados, como marcação e uso de um dicionário de dados, ele garante que a cópia aumentada possa ser descoberta por todos, evitando cópias duplicadas semelhantes.
Experimente o Databricks SQL gratuitamente
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.