Σχέδιο αστεριών και νιφάδων χιονιού στην αποθήκη δεδομένων με παραδείγματα

Πίνακας περιεχομένων:

Anonim

Τι είναι το Πολυδιάστατο σχήμα;

Το πολυδιάστατο σχήμα είναι ειδικά σχεδιασμένο για τη μοντελοποίηση συστημάτων αποθήκης δεδομένων. Τα σχήματα έχουν σχεδιαστεί για την αντιμετώπιση των μοναδικών αναγκών πολύ μεγάλων βάσεων δεδομένων που έχουν σχεδιαστεί για τον αναλυτικό σκοπό (OLAP).

Τύποι σχήματος αποθήκης δεδομένων:

Ακολουθούν 3 κύριοι τύποι πολυδιάστατων σχημάτων που ο καθένας έχει τα μοναδικά του πλεονεκτήματα.

  • Σχήμα αστεριών
  • Σχέδιο νιφάδας χιονιού
  • Σχέδιο γαλαξίας

Σε αυτό το σεμινάριο, θα μάθετε περισσότερα για-

  • Τι είναι ένα αστρικό σχήμα;
  • Τι είναι ένα σχήμα νιφάδας χιονιού;
  • Star Schema Vs Snowflake Schema: Βασικές διαφορές
  • Τι είναι ένα σχήμα Galaxy;
  • Τι είναι το σχήμα συμπλέγματος αστεριών;

Τι είναι ένα αστρικό σχήμα;

Σχήμα αστεριών στην αποθήκη δεδομένων, στην οποία το κέντρο του αστεριού μπορεί να έχει έναν πίνακα γεγονότων και έναν αριθμό σχετικών πινάκων διαστάσεων. Είναι γνωστό ως σχήμα αστεριού, καθώς η δομή του μοιάζει με αστέρι. Το μοντέλο δεδομένων Star Schema είναι ο απλούστερος τύπος σχήματος Data Warehouse. Είναι επίσης γνωστό ως Star Join Schema και βελτιστοποιείται για την αναζήτηση μεγάλων συνόλων δεδομένων.

Στο ακόλουθο παράδειγμα αστεριού σχήματος, ο πίνακας γεγονότων βρίσκεται στο κέντρο που περιέχει κλειδιά για κάθε πίνακα διαστάσεων, όπως Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID και άλλα χαρακτηριστικά, όπως πωλούνται μονάδες και έσοδα.

Παράδειγμα διαγράμματος σχήματος αστεριών

Χαρακτηριστικά του αστεριού σχήματος:

  • Κάθε διάσταση σε ένα σχήμα αστεριού παρουσιάζεται με τον μοναδικό πίνακα μίας διάστασης.
  • Ο πίνακας διαστάσεων πρέπει να περιέχει το σύνολο χαρακτηριστικών.
  • Ο πίνακας διαστάσεων συνδέεται με τον πίνακα γεγονότων χρησιμοποιώντας ένα ξένο κλειδί
  • Ο πίνακας διαστάσεων δεν συνδέεται μεταξύ τους
  • Ο πίνακας γεγονότων θα περιέχει το κλειδί και το μέτρο
  • Το σχήμα Star είναι κατανοητό και παρέχει βέλτιστη χρήση δίσκου.
  • Οι πίνακες διαστάσεων δεν είναι κανονικοποιημένοι. Για παράδειγμα, στο παραπάνω σχήμα, το Country_ID δεν διαθέτει πίνακα αναζήτησης χώρας όπως θα είχε ένα σχέδιο OLTP.
  • Το σχήμα υποστηρίζεται ευρέως από τα BI Tools

Τι είναι ένα σχήμα νιφάδας χιονιού;

Το Snowflake Schema στην αποθήκη δεδομένων είναι μια λογική διάταξη πινάκων σε μια πολυδιάστατη βάση δεδομένων έτσι ώστε το διάγραμμα ER να μοιάζει με σχήμα νιφάδας χιονιού. Το Snowflake Schema είναι μια επέκταση ενός αστεριού σχήματος και προσθέτει επιπλέον διαστάσεις. Οι πίνακες διαστάσεων είναι κανονικοποιημένοι που χωρίζουν τα δεδομένα σε επιπλέον πίνακες.

Στο ακόλουθο παράδειγμα Snowflake Schema, το Country εξομαλύνεται περαιτέρω σε έναν ξεχωριστό πίνακα.

Παράδειγμα σχήματος νιφάδας χιονιού

Χαρακτηριστικά του σχήματος νιφάδας χιονιού:

  • Το κύριο πλεονέκτημα του σχήματος νιφάδας χιονιού χρησιμοποιεί μικρότερο χώρο στο δίσκο.
  • Ευκολότερη εφαρμογή μιας διάστασης προστίθεται στο σχήμα
  • Λόγω πολλών πινάκων, η απόδοση του ερωτήματος μειώνεται
  • Η κύρια πρόκληση που θα αντιμετωπίσετε κατά τη χρήση του σχήματος νιφάδας χιονιού είναι ότι πρέπει να κάνετε περισσότερες προσπάθειες συντήρησης λόγω των περισσότερων πινάκων αναζήτησης.

Star Schema Vs Snowflake Schema: Βασικές διαφορές

Ακολουθεί μια βασική διαφορά μεταξύ του Star Schema και του Snowflake Schema:

Σχήμα αστεριών Σχέδιο νιφάδας χιονιού
Οι ιεραρχίες για τις διαστάσεις αποθηκεύονται στον πίνακα διαστάσεων. Οι ιεραρχίες χωρίζονται σε ξεχωριστούς πίνακες.
Περιέχει έναν πίνακα πληροφοριών που περιβάλλεται από πίνακες διαστάσεων. Ένας πίνακας γεγονότων που περιβάλλεται από πίνακα διαστάσεων που με τη σειρά του περιβάλλεται από πίνακα διαστάσεων
Σε ένα σχήμα αστεριού, μόνο ένας συνδυασμός δημιουργεί τη σχέση μεταξύ του πίνακα γεγονότων και τυχόν πινάκων διαστάσεων. Ένα σχήμα νιφάδας χιονιού απαιτεί πολλές συνδέσεις για τη λήψη των δεδομένων.
Απλή σχεδίαση DB. Πολύ περίπλοκος σχεδιασμός DB.
Η δομή και το ερώτημα αποδιαμορφωμένων δεδομένων εκτελούνται επίσης πιο γρήγορα. Κανονικοποιημένη δομή δεδομένων.
Υψηλό επίπεδο πλεονασμού δεδομένων Πολύ χαμηλό επίπεδο πλεονασμού δεδομένων
Ο πίνακας μίας διάστασης περιέχει συγκεντρωτικά δεδομένα. Διαχωρισμός δεδομένων σε διαφορετικούς πίνακες διαστάσεων.
Η επεξεργασία του κύβου είναι ταχύτερη. Η επεξεργασία του κύβου ενδέχεται να είναι αργή λόγω της σύνθετης σύνδεσης.
Προσφέρει ερωτήματα υψηλότερης απόδοσης χρησιμοποιώντας τη Βελτιστοποίηση ερωτημάτων συμμετοχής Star. Οι πίνακες μπορούν να συνδεθούν με πολλαπλές διαστάσεις. Το σχήμα Snowflake αντιπροσωπεύεται από συγκεντρωτικό πίνακα γεγονότων που απίθανο να συνδέεται με πολλαπλές διαστάσεις.

Τι είναι το γαλαξιακό σχήμα;

Το Galaxy Schema περιέχει δύο πίνακες γεγονότων που μοιράζονται πίνακες διαστάσεων μεταξύ τους. Ονομάζεται επίσης Fact Constellation Schema. Το σχήμα θεωρείται ως μια συλλογή από αστέρια εξ ου και το όνομα Galaxy Schema.

Παράδειγμα γαλαξιακού σχήματος

Όπως μπορείτε να δείτε στο παραπάνω παράδειγμα, υπάρχουν δύο πίνακες γεγονότων

  1. Εσοδα
  2. Προϊόν.

Στο σχήμα σχήματος Galaxy οι διαστάσεις ονομάζονται διαμορφωμένες διαστάσεις.

Χαρακτηριστικά του σχήματος Galaxy:

  • Οι διαστάσεις σε αυτό το σχήμα χωρίζονται σε ξεχωριστές διαστάσεις με βάση τα διάφορα επίπεδα ιεραρχίας.
  • Για παράδειγμα, εάν η γεωγραφία έχει τέσσερα επίπεδα ιεραρχίας όπως περιοχή, χώρα, πολιτεία και πόλη, τότε το σχήμα Galaxy θα πρέπει να έχει τέσσερις διαστάσεις.
  • Επιπλέον, είναι δυνατό να δημιουργηθεί αυτός ο τύπος σχήματος διαχωρίζοντας το σχήμα ενός αστεριού σε περισσότερα σχήματα αστεριών.
  • Οι διαστάσεις είναι μεγάλες σε αυτό το σχήμα που απαιτείται για τη δημιουργία με βάση τα επίπεδα της ιεραρχίας.
  • Αυτό το σχήμα είναι χρήσιμο για τη συγκέντρωση πινάκων γεγονότων για καλύτερη κατανόηση.

Τι είναι το σχήμα συμπλέγματος αστεριών;

Το σχήμα νιφάδας χιονιού περιέχει πλήρως διευρυμένες ιεραρχίες. Ωστόσο, αυτό μπορεί να προσθέσει πολυπλοκότητα στο Σχέδιο και απαιτεί επιπλέον συμμετοχές. Από την άλλη πλευρά, το σχήμα αστεριών περιέχει πλήρως καταρρέουσες ιεραρχίες, οι οποίες μπορεί να οδηγήσουν σε πλεονασμό. Έτσι, η καλύτερη λύση μπορεί να είναι μια ισορροπία μεταξύ αυτών των δύο σχημάτων που είναι ο σχεδιασμός Star Cluster Schema.

Παράδειγμα σχηματισμού αστεριών συστάδων

Οι επικαλυπτόμενες διαστάσεις μπορούν να βρεθούν ως πιρούνια στις ιεραρχίες. Ένα πιρούνι συμβαίνει όταν μια οντότητα ενεργεί ως γονέας σε δύο διαφορετικές διαστάσεις ιεραρχίες. Στη συνέχεια, οι οντότητες Fork ταυτοποιήθηκαν ως ταξινόμηση με σχέσεις «ένα προς πολλά».

Περίληψη:

  • Το πολυδιάστατο σχήμα έχει σχεδιαστεί ειδικά για τη μοντελοποίηση συστημάτων αποθήκης δεδομένων
  • Το σχήμα αστεριού είναι ο απλούστερος τύπος σχήματος Data Warehouse. Είναι γνωστό ως σχήμα αστεριού, καθώς η δομή του μοιάζει με αστέρι.
  • Το Snowflake Schema είναι μια επέκταση ενός αστεριού σχήματος και προσθέτει επιπλέον διαστάσεις. Ονομάζεται νιφάδα χιονιού επειδή το διάγραμμά του μοιάζει με νιφάδα χιονιού.
  • Σε ένα σχήμα αστεριού, μόνο ένας συνδυασμός καθορίζει τη σχέση μεταξύ του πίνακα γεγονότων και τυχόν πινάκων διαστάσεων.
  • Το σχήμα αστεριού περιέχει έναν πίνακα γεγονότων που περιβάλλεται από πίνακες διαστάσεων.
  • Το σχήμα νιφάδας χιονιού περιβάλλεται από πίνακα διαστάσεων που με τη σειρά του περιβάλλεται από πίνακα διαστάσεων
  • Ένα σχήμα νιφάδας χιονιού απαιτεί πολλές συνδέσεις για τη λήψη των δεδομένων.
  • Το Galaxy Schema περιέχει δύο πίνακες γεγονότων που μοιράζονται πίνακες διαστάσεων. Ονομάζεται επίσης Fact Constellation Schema.
  • Το σχήμα συμπλέγματος αστεριών περιέχει χαρακτηριστικά του σχήματος αστεριών και νιφάδων χιονιού.