Ir al contenido principal

¿Qué es el esquema Snowflake?

Diseño de almacén que extiende el esquema en estrella al normalizar las tablas de dimensiones en múltiples tablas relacionadas, lo que reduce la redundancia y agrega complejidad a las consultas.

4 Personas Agnostic 1a

Summary

  • Normaliza las tablas de dimensiones en estructuras jerárquicas (como producto, categoría y departamento), creando múltiples tablas relacionadas conectadas mediante claves externas, a diferencia de las dimensiones desnormalizadas del esquema en estrella.
  • Reduce el espacio de almacenamiento y las anomalías de actualización mediante la normalización, eliminando la redundancia de datos, lo que resulta beneficioso para tablas de grandes dimensiones con muchos niveles jerárquicos y atributos que requieren actualizaciones frecuentes.
  • Aumenta la complejidad de las consultas, lo que requiere más uniones para reconstruir el contexto dimensional completo, lo que puede afectar el rendimiento de las consultas a pesar del ahorro de almacenamiento, lo que lo hace menos favorable para cargas de trabajo analíticas con alta carga de lectura en comparación con el esquema en estrella.

¿Qué es un esquema de copo de nieve?

Un esquema de copo de nieve es un modelo de datos multidimensional que es una extensión de un esquema de estrella, en el que las tablas de dimensiones se desglosan en subdimensiones. Los esquemas de copo de nieve se usan comúnmente para la inteligencia empresarial y la generación de informes en almacenes de datos OLAP, data marts y bases de datos relacionales.

En un esquema de copo de nieve, los ingenieros descomponen las tablas de dimensiones individuales en subdimensiones lógicas. Esto hace que el modelo de datos sea más complejo, pero puede facilitarles el trabajo a los analistas, especialmente con ciertos tipos de datos.

Se llama esquema de copo de nieve porque su diagrama de entidad-relación (ERD) se parece a un copo de nieve, como se ve a continuación.

Esquemas de copo de nieve vs. esquemas de estrella

Al igual que los esquemas de estrella, los esquemas de copo de nieve tienen una tabla de hechos central que se conecta a varias tablas de dimensiones mediante claves foráneas. Sin embargo, la principal diferencia es que están más normalizadas que los esquemas de estrella.

Los esquemas de copo de nieve ofrecen una mayor eficiencia de almacenamiento, debido a su mayor adherencia a los altos estándares de normalización, pero el rendimiento de las consultas no es tan bueno como con los modelos de datos más desnormalizados. Los modelos de datos desnormalizados, como los esquemas de estrella, tienen más redundancia de datos (duplicación de datos), lo que hace que el rendimiento de las consultas sea más rápido a costa de los datos duplicados.

LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

Beneficios de los esquemas de copo de nieve

  • Recuperación rápida de datos
  • Garantiza la calidad de los datos
  • Modelo de datos simple y común para el almacenamiento de datos

Desventajas de los esquemas de copo de nieve

  • Mucha sobrecarga en la configuración inicial
  • Modelo de datos rígido
  • Costos de mantenimiento elevados

RECURSOS

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.