Direkt zum Hauptinhalt

Was ist das Snowflake-Schema?

Das Warehouse-Design erweitert das Sternschema durch die Normalisierung von Dimensionstabellen in mehrere verknüpfte Tabellen, wodurch Redundanz reduziert, aber die Abfragekomplexität erhöht wird.

4 Personas Agnostic 1a
Data + AI GrundlagenWeniger als eine Minute

Summary

  • Normalisiert Dimensionstabellen in hierarchische Strukturen (z. B. Produkt → Kategorie → Abteilung) und erstellt so mehrere verknüpfte Tabellen, die über Fremdschlüssel verbunden sind. Dies steht im Gegensatz zu den denormalisierten Dimensionen des Sternschemas.
  • Reduziert Speicherplatz und Aktualisierungsanomalien durch die Normalisierung, da Datenredundanz beseitigt wird. Dies ist vorteilhaft für große Dimensionstabellen mit vielen Hierarchieebenen und Attributen, die häufige Aktualisierungen erfordern.
  • Erhöht die Abfragekomplexität, da mehr Joins benötigt werden, um den vollständigen Dimensionskontext wiederherzustellen. Dies kann trotz der Speichereinsparungen die Abfrageleistung beeinträchtigen und ist daher für leseintensive analytische Workloads im Vergleich zum Sternschema weniger geeignet.

Was ist ein Schneeflockenschema?

Ein Schneeflockenschema ist ein mehrdimensionales Datenmodell, das eine Erweiterung eines Sternschemas darstellt, bei dem die Dimensionstabellen in Unterdimensionen aufgeteilt sind. Schneeflockenschemata werden häufig für Business Intelligence und Reporting in OLAP Data Warehouses, Data Marts und relationalen Datenbanken verwendet.

In einem Schneeflockenschema unterteilen Engineers einzelne Dimensionstabellen in logische Teildimensionen. Dadurch wird das Datenmodell zwar komplexer, kann aber – insbesondere bei bestimmten Datentypen – für Analysten einfacher zu bearbeiten sein.

Vom Schneeflockenschema ist die Rede, weil sein Entity-Relationship-Diagramm (ERD) – wie nachfolgend gezeigt – wie eine Schneeflocke aussieht.

Schneeflocken- und Sternschemata im Vergleich

Wie Sternschemata haben auch Schneeflockenschemata eine zentrale Faktentabelle, die über Fremdschlüssel mit mehreren Dimensionstabellen vernetzt ist. Der Hauptunterschied besteht allerdings darin, dass sie stärker normalisiert sind als Sternschemata.

Schneeflockenschemata bieten aufgrund ihrer strikten Einhaltung hoher Normalisierungsstandards mehr Speichereffizienz, doch ist die Abfrageleistung nicht so gut wie bei stärker denormalisierten Datenmodellen. Denormalisierte Datenmodelle wie Sternschemata weisen mehr Datenredundanz (d. h. duplizierte Daten) auf, wodurch die Abfrageleistung auf Kosten der Datenduplizierung beschleunigt wird.

5-FACHER LEADER

Gartner®: Databricks als Leader für Cloud-Datenbanken

Vorteile von Schneeflockenschemata

  • Schneller Datenabruf
  • Sicherstellung von Datenqualität
  • Einfaches und gängiges Datenmodell für Data Warehousing

Nachteile von Schneeflockenschemata

  • Erheblicher Aufwand bei der Ersteinrichtung
  • Starres Datenmodell
  • Hohe Unterhaltskosten

Ressourcen

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.