Unterschied zwischen Stern- und Schneeflockenschema

Unterschied zwischen Stern- und Schneeflockenschema

Data Warehousing ist ein System, mit dem Daten in zentralen Repositories gespeichert und organisiert werden können, einschließlich Daten aus anderen Quellen. Es ist ein zentrales Konzept der Business Intelligence in relationalen Datenbankmodellen, die analytische Techniken zur Integration von Geschäftsdaten in eine zentrale Datenbank verwenden.

Es gibt zwei gemeinsame Architekturmodelle, die in Data Warehousing verwendet werden:

  • Sternschema
  • Schneeflockenschema

Beide sind die gemeinsamen mehrdimensionalen Datenbankmodelle, die verwendet werden, um die Anforderungen großer Datenbanken für die analytischen Zwecke in realen Data Warehouses zu befriedigen.

Wir präsentieren einen unvoreingenommenen Vergleich zwischen den beiden, um besser zu verstehen, welches besser ist als der andere.

Was ist Sternschema?

Es ist das häufigste und am häufigsten anerkannte Architekturmodell zur Entwicklung von Data Warehouses und Data Marts, in denen die Daten in Fakten und Dimensionen organisiert sind. Es ist das einfachste Architekturmodell, bei dem eine Faktentabelle verwendet wird, um auf mehreren Dimensionstabellen zu verweisen, wodurch ein Sternmuster imitiert wird.

Wie der Name schon sagt, ähnelt das Diagramm einem Stern mit der Faktentabelle in der Mitte und mehreren Dimensionstabellen, die daraus strahlen und ein sternähnliches Muster erzeugen.

Es ist auch als Stern -Join -Schema bekannt und speichert alle Attribute einer Dimension in eine denormalisierte Faktentabelle, um schnell durch große mehrdimensionale Datensätze zu navigieren.

Was ist ein Schneeflockenschema?

Es ist eine Erweiterung des Sternschemas mit zusätzlichen Funktionen. Im Gegensatz zum Sternschema werden die Dimensionstabellen im Schneeflockenschema in mehrere verwandte Tabellen normalisiert.

Das architektonische Modell stellt eine logische Anordnung von Tabellen in einer vielen zu einem Beziehungshierarchie dar, in der mehrere Dimensionstabellen in subdimensionale Tabellen normalisiert werden, was einer schneebedeckten Muster ähnelt, daher der Name.

Es handelt sich um eine komplexere Version des Sternenschemas mit mehr Verknüpfungen zwischen Dimensionstabellen, was für die langsame Verarbeitungszeit zum Abrufen von Daten verantwortlich ist, was bedeutet, dass langsame Abfragen -Antwortzeiten erforderlich sind. Es minimiert die Datenauf Redundanz, die wiederum die Abfrageleistung verbessert.

Unterschied zwischen Stern- und Schneeflockenschema

Architektur des Stern- und Schneeflockenschemas

In relationalen Datenbanken ist das Sternschema das einfachste Architekturmodell für die Entwicklung von Data Warehouses und mehrdimensionalen Datenmarts. Wie der Name schon sagt, ähnelt das Modell einem Stern mit Punkten aus dem Zentrum, was bedeutet. Wie andere dimensionale Modelle besteht es aus Daten in Form von Fakten und Dimensionen. Snowflake -Schema hingegen ist das komplexere Architekturmodell, das sich auf eine mehrdimensionale Datenbank mit logischer Anordnung von Tabellen in Form einer Schneeflocke bezieht.

Dimensionstabelle

Das Schneeflockenschema ist dem Sternschema ziemlich ähnlich, außer dass es mehr als eine Dimensionstabellen haben kann, die in mehreren verwandten Tabellen, die als subdimensionale Tabellen bezeichnet werden, weiter normalisiert werden. Es repräsentiert mehrere Beziehungsebenen, die sich in ein Schneeflockenmuster verzweigen. Das Sternschema speichert jedoch alle verwandten Attribute einer Dimension in einer denormalisierten Dimensionstabelle, die es einfacher macht, einfachere Abfragen zu verstehen und umzugehen.

Geschäftsmodell des Stern- und Schneeflockenschemas

Eine Dimensionstabelle kann keine doppelten Zeilen in relationalen Datenbankmodellen enthalten, um die einfachen Tatsache, dass sie beim Abrufen Mehrdeutigkeiten erzeugen können. Jede Tabelle sollte eine Spalte oder eine Kombination von Spalten haben, die als Primärschlüssel bezeichnet werden, die alle Tabellenaufzeichnungen eindeutig identifiziert. Ein Fremdschlüssel ist eine Spalte oder eine Gruppe von Spalten, die eine Verbindung zwischen zwei Tabellen liefert. Im Sternschema hat jede Dimensionstabelle einen Primärschlüssel, der mit einem Fremdschlüssel in der Faktentabelle zusammenhängt. Die Geschäftshierarchie in einem Schneeflockenschema wird durch eine primäre Schlüssel-/Fremdschlüsselbeziehung zwischen Dimensionstabellen dargestellt.

Datenintegrität im Stern- und Schneeflockenschema

Der Schlüsselunterschied zwischen den beiden relationalen Datenbankmodellen ist die Normalisierung. Die Dimensionstabellen im Sternschema sind nicht normalisiert, was bedeutet. Das Schneeflockenschema hingegen minimiert die Datenreduktion, da Dimensionstabellen normalisiert werden, was weitaus weniger redundante Datensätze ausmacht. Die Geschäftshierarchie und ihre Dimensionen werden durch Referenzintegrität erhalten. Bedeutet die Beziehungen können unabhängig in Data Warehouses aktualisiert werden.

Abfrageleistung

Das Sternschema hat weniger Verknüpfungen zwischen Dimensionstabelle und Faktentabelle im Vergleich zu dem des Schneeflockenschemas, das mehrere Verknüpfungen enthält, was für eine geringere Komplexität der Abfrage verantwortlich ist. Da die Dimensionen in einem Sternschema über eine zentrale Faktentabelle verknüpft sind, gibt es klare Join -Pfade, die schnelle Reaktionszeiten und schnelle Reaktionszeiten bedeuten. Snowflake -Schema hat eine höhere Anzahl von Verbindungen, die so längere Abfragemaßzeiten führen, was zu komplexeren Abfragen führt, was letztendlich die Leistung beeinträchtigt.

Sternschema vs. Schneeflockenschema: Vergleichstabelle


Zusammenfassung der Sternverse Schneeflockenschema

Beide sind die häufigsten und am häufigsten angenommenen Architekturmodelle, die zur Entwicklung von Datenbanklagern und Datenmarts verwendet werden. Jedes Geschäftsmodell hat jedoch einen angemessenen Anteil an Vor- und Nachteilen. Während das Sternenschema das einfachste mehrdimensionale Modell ist, das zum Organisieren von Daten in Fakten und Dimensionen verwendet wird, ist es ideal für die Entwicklung von Datenmarts, die weniger komplexe Beziehungen umfassen. Snowflake-Schema ist eine logische Darstellung von Tabellen in einer mehrdimensionalen Datenbank, in der die Dimensionen in Subdimensionstabellen gespeichert werden. Der Hauptunterschied zwischen beiden ist die Normalisierung. Die Dimensionstabellen in einem Schneeflockenschema werden vollständig in mehrere Look-Up-Tabellen normalisiert, während in einem Sternschema die Dimensionstabellen in einer zentralen Faktentabelle denormalisiert werden.