Ir para o conteúdo principal

O que é o Snowflake Schema?

O projeto de data warehouse estende o esquema em estrela, normalizando tabelas de dimensão em múltiplas tabelas relacionadas, reduzindo a redundância e, ao mesmo tempo, aumentando a complexidade das consultas.

4 Personas Agnostic 1a

Summary

  • Normaliza tabelas de dimensão em estruturas hierárquicas (como produto, categoria e departamento), criando múltiplas tabelas relacionadas conectadas por meio de chaves estrangeiras, em contraste com as dimensões desnormalizadas do esquema em estrela.
  • Reduz o espaço de armazenamento e as anomalias de atualização por meio da normalização, eliminando a redundância de dados. Isso é benéfico para grandes tabelas de dimensão com muitos níveis hierárquicos e atributos que exigem atualizações frequentes.
  • Aumenta a complexidade das consultas, exigindo mais junções para reconstruir o contexto dimensional completo. Isso pode impactar o desempenho das consultas, apesar da economia de armazenamento, tornando-o menos favorável para cargas de trabalho analíticas com grande volume de leitura em comparação com o esquema em estrela.

O que é um esquema snowflake?

Um esquema em floco de neve é um modelo de dados multidimensional e uma extensão do esquema em estrela, subdividindo as tabelas de dimensão em tabelas de subdimensão. Os esquemas em floco de neve são comumente usados para business intelligence e relatórios usando análise multidimensional em data warehouses, data marts e bancos de dados relacionais.

Em um esquema em floco de neve, os engenheiros subdividem cada tabela de dimensão em subdimensões lógicas. Isso deixa o modelo de dados mais complexo, mas torna mais fácil para os analistas trabalharem com determinados formatos de dados.

É chamado de esquema em floco de neve porque o Diagrama Entidade-Relacionamento (ERD) se parece com um floco de neve, conforme mostrado abaixo.

Esquemas em floco de neve x esquemas em estrela

Semelhantes aos esquemas em estrela, os esquemas em floco de neve também possuem uma tabela de fatos central, conectada a várias tabelas de dimensão por meio de chaves estrangeiras. No entanto, ao contrário dos esquemas em estrela, os esquemas em floco de neve são mais normalizados.

Um esquema em floco de neve adere estritamente a um alto padrão de normalização e é eficiente em termos de armazenamento, mas tem um desempenho de tempo de query inferior ao de um modelo de dados desnormalizado. Por outro lado, modelos de dados desnormalizados, como esquemas em estrela, têm alta redundância de dados (duplicação de dados) e podem acelerar o desempenho da query em detrimento da duplicação de dados.

UM LÍDER 5X

Gartner®: Databricks, líder em banco de dados em nuvem

Benefícios dos esquemas em floco de neve

  • Recuperação rápida de dados
  • Garantia da qualidade dos dados
  • Modelo de dados simples e comum para armazenamento de dados

Desvantagens dos esquemas em floco de neve

  • Muita sobrecarga na configuração inicial
  • Modelo de dados rígido
  • Altos custos de manutenção

Recursos

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada