Revenir au contenu principal

Schéma en flocon de neige

Essayer Gratuitement Databricks

Qu’est-ce qu’un schéma en flocon de neige ?

Un schéma en flocon de neige est un modèle de données multidimensionnel qui est une extension d’un schéma en étoile. Dans ce type de schéma, les tables de dimension sont décomposées en sous-dimensions. Les schémas en flocon de neige sont couramment utilisés dans la Business Intelligence, le reporting dans les data warehouses OLAP, les data marts et les bases de données relationnelles.

Dans un schéma en flocon de neige, les ingénieurs décomposent les tables de dimension individuelles en sous-dimensions logiques. Le modèle de données est donc plus complexe. Toutefois, il peut être plus facile à utiliser pour les analystes, en particulier pour certains types de données.

On l’appelle schéma en flocon de neige parce que son diagramme entité-association (ERD) ressemble à un flocon de neige, comme on peut le voir ci-dessous.

Différences entre les schémas en flocon de neige et les schémas en étoile

Tout comme les schémas en étoile, les schémas en flocon de neige possèdent une table de faits centrale reliée à plusieurs tables de dimension par des clés étrangères. Il existe toutefois une différence majeure : les schémas en flocon de neige sont plus normalisés que les schémas en étoile.

En raison de leur respect rigoureux des normes et standards, les schémas en flocon de neige offrent une meilleure efficacité de stockage. En revanche, les performances de la requête ne sont pas aussi bonnes qu’avec des modèles de données plus dénormalisés. En effet, les modèles de données dénormalisés tels que les schémas en étoile présentent une plus grande redondance (duplication des données), ce qui accélère les performances des requêtes aux dépens des données dupliquées.

Avantages des schémas en flocon de neige

  • Récupération des données rapide
  • Qualité des données assurée
  • Modèle de données simple et commun pour l’entreposage des données

Inconvénients des schémas en flocon de neige

  • Frais de configuration initiale élevés
  • Modèle de données rigide
  • Nécessitent des frais d’entretien importants

Ressources

    Retour au glossaire