Αρχιτεκτονική, έννοιες και στοιχεία της αποθήκης δεδομένων

Πίνακας περιεχομένων:

Anonim

Έννοιες αποθήκης δεδομένων

Η βασική ιδέα μιας Data Warehouse είναι η διευκόλυνση μιας ενιαίας έκδοσης της αλήθειας για μια εταιρεία για τη λήψη αποφάσεων και την πρόβλεψη. Η αποθήκη δεδομένων είναι ένα σύστημα πληροφοριών που περιέχει ιστορικά και εναλλακτικά δεδομένα από μεμονωμένες ή πολλαπλές πηγές. Το Data Warehouse Concepts απλοποιεί τη διαδικασία αναφοράς και ανάλυσης οργανισμών.

Χαρακτηριστικά της αποθήκης δεδομένων

Οι έννοιες αποθήκης δεδομένων έχουν τα ακόλουθα χαρακτηριστικά:

  • Με γνώμονα το θέμα
  • Ολοκληρωμένο
  • Παραλλαγή χρόνου
  • Μη πτητικό

Με γνώμονα το θέμα

Μια αποθήκη δεδομένων είναι προσανατολισμένη στο θέμα καθώς προσφέρει πληροφορίες σχετικά με ένα θέμα αντί για τις συνεχιζόμενες δραστηριότητες των εταιρειών. Αυτά τα θέματα μπορεί να είναι πωλήσεις, μάρκετινγκ, διανομές κ.λπ.

Μια αποθήκη δεδομένων δεν εστιάζει ποτέ στις τρέχουσες δραστηριότητες. Αντίθετα, έδωσε έμφαση στη μοντελοποίηση και ανάλυση δεδομένων για τη λήψη αποφάσεων . Παρέχει επίσης μια απλή και περιεκτική εικόνα γύρω από το συγκεκριμένο θέμα, αποκλείοντας δεδομένα που δεν βοηθούν στην υποστήριξη της διαδικασίας λήψης αποφάσεων.

Ολοκληρωμένο

Στο Data Warehouse, ολοκλήρωση σημαίνει τη δημιουργία μιας κοινής μονάδας μέτρησης για όλα τα παρόμοια δεδομένα από τη διαφορετική βάση δεδομένων. Τα δεδομένα πρέπει επίσης να αποθηκευτούν στην αποθήκη δεδομένων με κοινό και καθολικά αποδεκτό τρόπο.

Μια αποθήκη δεδομένων αναπτύσσεται ενσωματώνοντας δεδομένα από διάφορες πηγές, όπως ένα mainframe, σχεσιακές βάσεις δεδομένων, επίπεδα αρχεία κ.λπ.

Αυτή η ενσωμάτωση βοηθά στην αποτελεσματική ανάλυση των δεδομένων. Πρέπει να διασφαλιστεί η συνοχή στις συμβάσεις ονομασίας, τα χαρακτηριστικά χαρακτηριστικών, η δομή κωδικοποίησης κ.λπ. Εξετάστε το ακόλουθο παράδειγμα:

Στο παραπάνω παράδειγμα, υπάρχουν τρεις διαφορετικές εφαρμογές με την ένδειξη Α, Β και Γ. Οι πληροφορίες που αποθηκεύονται σε αυτές τις εφαρμογές είναι Φύλο, Ημερομηνία και Υπόλοιπο. Ωστόσο, τα δεδομένα κάθε εφαρμογής αποθηκεύονται με διαφορετικό τρόπο.

  • Στην εφαρμογή Ένα πεδίο φύλου αποθηκεύονται λογικές τιμές όπως M ή F
  • Στην εφαρμογή Β το πεδίο φύλου είναι μια αριθμητική τιμή,
  • Στην εφαρμογή Εφαρμογή Γ, το πεδίο φύλου αποθηκεύεται με τη μορφή τιμής χαρακτήρα.
  • Το ίδιο ισχύει με την ημερομηνία και το υπόλοιπο

Ωστόσο, μετά τη διαδικασία μετασχηματισμού και καθαρισμού όλα αυτά τα δεδομένα αποθηκεύονται σε κοινή μορφή στην αποθήκη δεδομένων.

Παραλλαγή χρόνου

Ο χρονικός ορίζοντας για την αποθήκη δεδομένων είναι αρκετά εκτεταμένος σε σύγκριση με τα λειτουργικά συστήματα. Τα δεδομένα που συλλέγονται σε μια αποθήκη δεδομένων αναγνωρίζονται με μια συγκεκριμένη περίοδο και προσφέρουν πληροφορίες από ιστορική άποψη. Περιέχει ένα στοιχείο του χρόνου, ρητά ή έμμεσα.

Ένα τέτοιο μέρος όπου τα δεδομένα Datawarehouse εμφανίζουν διακύμανση χρόνου στη δομή του κλειδιού εγγραφής. Κάθε πρωτεύον κλειδί που περιέχεται στο DW θα πρέπει να έχει είτε έμμεσα είτε ρητά ένα στοιχείο του χρόνου. Όπως την ημέρα, τον μήνα της εβδομάδας κ.λπ.

Μια άλλη πτυχή της διακύμανσης του χρόνου είναι ότι μόλις εισαχθούν δεδομένα στην αποθήκη, δεν μπορεί να ενημερωθεί ή να αλλάξει.

Μη πτητικό

Η αποθήκη δεδομένων είναι επίσης ασταθής σημαίνει ότι τα προηγούμενα δεδομένα δεν διαγράφονται όταν εισάγονται νέα δεδομένα σε αυτήν.

Τα δεδομένα είναι μόνο για ανάγνωση και ανανεώνονται περιοδικά. Αυτό βοηθά επίσης στην ανάλυση ιστορικών δεδομένων και στην κατανόηση του τι και πότε συνέβη. Δεν απαιτεί τη διαδικασία συναλλαγών, την ανάκτηση και τους μηχανισμούς ελέγχου ταυτόχρονης λειτουργίας.

Δραστηριότητες όπως διαγραφή, ενημέρωση και εισαγωγή που εκτελούνται σε λειτουργικό περιβάλλον εφαρμογής παραλείπονται στο περιβάλλον αποθήκης δεδομένων. Μόνο δύο τύποι λειτουργιών δεδομένων που εκτελούνται στην αποθήκευση δεδομένων είναι

  1. Φόρτωση δεδομένων
  2. Πρόσβαση δεδομένων

Εδώ είναι μερικές σημαντικές διαφορές μεταξύ Εφαρμογής και Αποθήκης δεδομένων

Λειτουργική εφαρμογή Αποθήκη δεδομένων
Το σύνθετο πρόγραμμα πρέπει να κωδικοποιηθεί για να διασφαλιστεί ότι οι διαδικασίες αναβάθμισης δεδομένων διατηρούν υψηλή ακεραιότητα του τελικού προϊόντος. Αυτό το είδος ζητημάτων δεν συμβαίνει επειδή δεν εκτελείται ενημέρωση δεδομένων.
Τα δεδομένα τοποθετούνται σε κανονικοποιημένη μορφή για να διασφαλιστεί η ελάχιστη απόλυση. Τα δεδομένα δεν αποθηκεύονται σε κανονικοποιημένη μορφή.
Τεχνολογία που απαιτείται για την υποστήριξη ζητημάτων συναλλαγών, ανάκτησης δεδομένων, επαναφοράς και ανάλυσης, καθώς το αδιέξοδο είναι αρκετά περίπλοκο. Προσφέρει σχετική απλότητα στην τεχνολογία.

Αρχιτεκτονική αποθήκης δεδομένων

Το Data Warehouse Architecture είναι περίπλοκο, καθώς είναι ένα σύστημα πληροφοριών που περιέχει ιστορικά και εναλλακτικά δεδομένα από πολλές πηγές. Υπάρχουν 3 προσεγγίσεις για την κατασκευή επιπέδων Data Warehouse: Single Tier, Two tier και Three tier. Αυτή η αρχιτεκτονική 3 βαθμίδων της Data Warehouse εξηγείται παρακάτω.

Μονοβάθμια αρχιτεκτονική

Ο στόχος ενός επιπέδου είναι να ελαχιστοποιηθεί η ποσότητα των δεδομένων που αποθηκεύονται. Αυτός ο στόχος είναι να αφαιρεθεί ο πλεονασμός δεδομένων. Αυτή η αρχιτεκτονική δεν χρησιμοποιείται συχνά στην πράξη.

Αρχιτεκτονική δύο επιπέδων

Η αρχιτεκτονική δύο επιπέδων είναι ένα από τα επίπεδα Data Warehouse που διαχωρίζει τις φυσικά διαθέσιμες πηγές και την αποθήκη δεδομένων. Αυτή η αρχιτεκτονική δεν είναι επεκτάσιμη και επίσης δεν υποστηρίζει μεγάλο αριθμό τελικών χρηστών. Έχει επίσης προβλήματα συνδεσιμότητας λόγω περιορισμών δικτύου.

Αρχιτεκτονική αποθήκης δεδομένων τριών επιπέδων

Αυτή είναι η πιο ευρέως χρησιμοποιούμενη αρχιτεκτονική της αποθήκης δεδομένων.

Αποτελείται από την κορυφή, τη μέση και την κατώτατη βαθμίδα.

  1. Κάτω επίπεδο: Η βάση δεδομένων των διακομιστών Datawarehouse ως το κατώτατο επίπεδο. Είναι συνήθως ένα σχεσιακό σύστημα βάσεων δεδομένων. Τα δεδομένα καθαρίζονται, μετασχηματίζονται και φορτώνονται σε αυτό το επίπεδο χρησιμοποιώντας εργαλεία back-end.
  2. Μεσαίο επίπεδο: Το μεσαίο επίπεδο στην αποθήκη δεδομένων είναι ένας διακομιστής OLAP ο οποίος υλοποιείται χρησιμοποιώντας είτε το μοντέλο ROLAP είτε το μοντέλο MOLAP. Για έναν χρήστη, αυτό το επίπεδο εφαρμογής παρουσιάζει μια αφηρημένη προβολή της βάσης δεδομένων. Αυτό το επίπεδο λειτουργεί επίσης ως μεσολαβητής μεταξύ του τελικού χρήστη και της βάσης δεδομένων.
  3. Top-Tier: Το ανώτερο επίπεδο είναι ένα επίπεδο πελάτη front-end. Το ανώτερο επίπεδο είναι τα εργαλεία και το API που συνδέετε και λαμβάνετε δεδομένα από την αποθήκη δεδομένων. Θα μπορούσε να είναι εργαλεία ερωτημάτων, εργαλεία αναφοράς, διαχειριζόμενα εργαλεία ερωτημάτων, εργαλεία ανάλυσης και εργαλεία εξόρυξης δεδομένων.

Στοιχεία αποθήκης δεδομένων

Θα μάθουμε για τα στοιχεία Datawarehouse και την αρχιτεκτονική της Data Warehouse με το διάγραμμα όπως φαίνεται παρακάτω:

Αρχιτεκτονική αποθήκης δεδομένων

Η αποθήκη δεδομένων βασίζεται σε έναν διακομιστή RDBMS που είναι ένας κεντρικός χώρος αποθήκευσης πληροφοριών που περιβάλλεται από ορισμένα βασικά στοιχεία αποθήκευσης δεδομένων για να κάνει ολόκληρο το περιβάλλον λειτουργικό, διαχειρίσιμο και προσβάσιμο.

Υπάρχουν κυρίως πέντε στοιχεία αποθήκης δεδομένων:

Βάση δεδομένων αποθήκης δεδομένων

Η κεντρική βάση δεδομένων είναι το θεμέλιο του περιβάλλοντος αποθήκευσης δεδομένων. Αυτή η βάση δεδομένων εφαρμόζεται στην τεχνολογία RDBMS. Αν και, αυτό το είδος εφαρμογής περιορίζεται από το γεγονός ότι το παραδοσιακό σύστημα RDBMS είναι βελτιστοποιημένο για επεξεργασία δεδομένων συναλλαγών και όχι για αποθήκευση δεδομένων. Για παράδειγμα, το ad-hoc ερώτημα, οι συνδυασμοί πολλαπλών πινάκων, τα συγκεντρωτικά στοιχεία είναι εντάσεως πόρων και επιβραδύνουν την απόδοση.

Ως εκ τούτου, χρησιμοποιούνται εναλλακτικές προσεγγίσεις στη βάση δεδομένων όπως αναφέρονται παρακάτω-

  • Σε μια αποθήκη δεδομένων, οι σχετικές βάσεις δεδομένων αναπτύσσονται παράλληλα για να επιτρέψουν την επεκτασιμότητα. Οι παράλληλες σχεσιακές βάσεις δεδομένων επιτρέπουν επίσης κοινόχρηστη μνήμη ή κοινόχρηστο μοντέλο σε διάφορες διαμορφώσεις πολλαπλών επεξεργαστών ή μαζικά παράλληλους επεξεργαστές.
  • Οι νέες δομές ευρετηρίου χρησιμοποιούνται για να παρακάμψουν τη σχεσιακή σάρωση πίνακα και να βελτιώσουν την ταχύτητα.
  • Χρήση πολυδιάστατης βάσης δεδομένων (MDDBs) για την υπέρβαση τυχόν περιορισμών που τίθενται λόγω των σχεσιακών Μοντέλων Αποθήκης Δεδομένων. Παράδειγμα: Essbase από την Oracle.

Εργαλεία προμήθειας, απόκτησης, καθαρισμού και μετασχηματισμού (ETL)

Τα εργαλεία προέλευσης δεδομένων, μετατροπής και μετεγκατάστασης χρησιμοποιούνται για την εκτέλεση όλων των μετατροπών, των συνόψεων και όλων των αλλαγών που απαιτούνται για τη μετατροπή των δεδομένων σε μια ενοποιημένη μορφή στην αποθήκη δεδομένων. Ονομάζονται επίσης Extract, Transform και Load (ETL) Tools

Η λειτουργικότητά τους περιλαμβάνει:

  • Ανωνυμοποιήστε δεδομένα σύμφωνα με τις κανονιστικές διατάξεις.
  • Εξάλειψη ανεπιθύμητων δεδομένων σε επιχειρησιακές βάσεις δεδομένων από φόρτωση στην αποθήκη δεδομένων.
  • Αναζήτηση και αντικατάσταση κοινών ονομάτων και ορισμών για δεδομένα που προέρχονται από διαφορετικές πηγές.
  • Υπολογισμός περιλήψεων και παραγόμενων δεδομένων
  • Σε περίπτωση που λείπουν δεδομένα, συμπληρώστε τα με προεπιλογές.
  • Επαναλαμβανόμενα επαναλαμβανόμενα δεδομένα που προέρχονται από πολλές πηγές δεδομένων.

Αυτά τα εργαλεία εξαγωγής, μετασχηματισμού και φόρτωσης μπορεί να δημιουργήσουν εργασίες cron, εργασίες φόντου, προγράμματα Cobol, σενάρια κελύφους κ.λπ. που ενημερώνουν τακτικά δεδομένα στην αποθήκη δεδομένων. Αυτά τα εργαλεία είναι επίσης χρήσιμα για τη διατήρηση των μεταδεδομένων.

Αυτά τα εργαλεία ETL πρέπει να αντιμετωπίσουν τις προκλήσεις της ετερογένειας βάσεων δεδομένων και δεδομένων.

Μεταδεδομένα

Το όνομα Meta Data προτείνει κάποιες τεχνολογίες υψηλού επιπέδου Τεχνολογίας Αποθήκευσης Δεδομένων. Ωστόσο, είναι αρκετά απλό. Τα μεταδεδομένα είναι δεδομένα σχετικά με δεδομένα που ορίζουν την αποθήκη δεδομένων. Χρησιμοποιείται για την κατασκευή, συντήρηση και διαχείριση της αποθήκης δεδομένων.

Στην Αρχιτεκτονική Data Warehouse, τα μετα-δεδομένα διαδραματίζουν σημαντικό ρόλο καθώς καθορίζει την πηγή, τη χρήση, τις τιμές και τα χαρακτηριστικά των δεδομένων αποθήκης δεδομένων. Καθορίζει επίσης τον τρόπο αλλαγής και επεξεργασίας των δεδομένων. Συνδέεται στενά με την αποθήκη δεδομένων.

Για παράδειγμα, μια γραμμή στη βάση δεδομένων πωλήσεων μπορεί να περιέχει:

4030 KJ732 299.90

Αυτά είναι χωρίς νόημα δεδομένα έως ότου συμβουλευτούμε το Meta που μας λέει ότι ήταν

  • Αριθμός μοντέλου: 4030
  • Αναγνωριστικό πωλητή: KJ732
  • Συνολικό ποσό πωλήσεων 299,90 $

Επομένως, τα Meta Data είναι απαραίτητα συστατικά για τη μετατροπή των δεδομένων σε γνώση.

Τα μεταδεδομένα βοηθούν στην απάντηση στις ακόλουθες ερωτήσεις

  • Τι πίνακες, χαρακτηριστικά και κλειδιά περιέχει η αποθήκη δεδομένων;
  • Από πού προέρχονται τα δεδομένα;
  • Πόσες φορές φορτώνονται ξανά τα δεδομένα;
  • Ποιοι μετασχηματισμοί εφαρμόστηκαν με τον καθαρισμό;

Τα μεταδεδομένα μπορούν να ταξινομηθούν σε ακόλουθες κατηγορίες:

  1. Τεχνικά μεταδεδομένα : Αυτό το είδος μεταδεδομένων περιέχει πληροφορίες σχετικά με την αποθήκη που χρησιμοποιούνται από σχεδιαστές και διαχειριστές αποθήκης δεδομένων.
  2. Επιχειρηματικά μεταδεδομένα: Αυτό το είδος μεταδεδομένων περιέχει λεπτομέρειες που παρέχουν στους τελικούς χρήστες έναν εύκολο και κατανοητό τρόπο πληροφορίες που αποθηκεύονται στην αποθήκη δεδομένων.

Εργαλεία ερωτημάτων

Ένα από τα κύρια αντικείμενα της αποθήκευσης δεδομένων είναι η παροχή πληροφοριών στις επιχειρήσεις για τη λήψη στρατηγικών αποφάσεων. Τα εργαλεία ερωτήματος επιτρέπουν στους χρήστες να αλληλεπιδρούν με το σύστημα αποθήκης δεδομένων.

Αυτά τα εργαλεία εμπίπτουν σε τέσσερις διαφορετικές κατηγορίες:

  1. Εργαλεία ερωτημάτων και αναφορών
  2. Εργαλεία ανάπτυξης εφαρμογών
  3. Εργαλεία εξόρυξης δεδομένων
  4. Εργαλεία OLAP

1. Εργαλεία αναζήτησης και αναφοράς:

Τα εργαλεία ερωτήματος και αναφοράς μπορούν να χωριστούν περαιτέρω σε

  • Εργαλεία αναφοράς
  • Διαχειριζόμενα εργαλεία ερωτημάτων

Εργαλεία αναφοράς:

Τα εργαλεία αναφοράς μπορούν να χωριστούν περαιτέρω σε εργαλεία αναφοράς παραγωγής και σε συγγραφέα αναφορών για επιτραπέζιους υπολογιστές.

  1. Συγγραφείς αναφορών: Αυτό το είδος εργαλείου αναφοράς είναι εργαλεία σχεδιασμένα για τελικούς χρήστες για την ανάλυσή τους.
  2. Αναφορά παραγωγής: Αυτό το είδος εργαλείων επιτρέπει στους οργανισμούς να δημιουργούν τακτικές επιχειρησιακές αναφορές. Υποστηρίζει επίσης εργασίες μεγάλου όγκου όπως εκτύπωση και υπολογισμός. Μερικά δημοφιλή εργαλεία αναφοράς είναι τα Brio, Business Objects, Oracle, PowerSoft, SAS Institute.

Διαχειριζόμενα εργαλεία ερωτημάτων:

Αυτό το είδος εργαλείων πρόσβασης βοηθά τους τελικούς χρήστες να επιλύσουν τα προβλήματα στη βάση δεδομένων και τη SQL και τη δομή της βάσης δεδομένων εισάγοντας μετα-επίπεδο μεταξύ χρηστών και βάσης δεδομένων.

2. Εργαλεία ανάπτυξης εφαρμογών:

Μερικές φορές τα ενσωματωμένα γραφικά και αναλυτικά εργαλεία δεν ικανοποιούν τις αναλυτικές ανάγκες ενός οργανισμού. Σε τέτοιες περιπτώσεις, οι προσαρμοσμένες αναφορές αναπτύσσονται χρησιμοποιώντας εργαλεία ανάπτυξης εφαρμογών.

3. Εργαλεία εξόρυξης δεδομένων:

Η εξόρυξη δεδομένων είναι μια διαδικασία ανακάλυψης σημαντικών νέων συσχετισμών, πατεντών και τάσεων εξόρυξης δεδομένων μεγάλου όγκου. Τα εργαλεία εξόρυξης δεδομένων χρησιμοποιούνται για να κάνουν αυτήν τη διαδικασία αυτόματη.

4. Εργαλεία OLAP:

Αυτά τα εργαλεία βασίζονται σε έννοιες μιας πολυδιάστατης βάσης δεδομένων. Επιτρέπει στους χρήστες να αναλύουν τα δεδομένα χρησιμοποιώντας περίπλοκες και πολύπλοκες πολυδιάστατες προβολές.

Αρχιτεκτονική λεωφορείων αποθήκης δεδομένων

Το Data Warehouse Bus καθορίζει τη ροή δεδομένων στην αποθήκη σας. Η ροή δεδομένων σε μια αποθήκη δεδομένων μπορεί να κατηγοριοποιηθεί ως Ροή εισροών, ροής, ροής, εκροής και μετα-ροής.

Κατά τον σχεδιασμό ενός Data Bus, πρέπει να λάβουμε υπόψη τις κοινές διαστάσεις, τα γεγονότα σε όλα τα δεδομένα.

Data Marts

Το data mart είναι ένα επίπεδο πρόσβασης το οποίο χρησιμοποιείται για τη μεταφορά δεδομένων στους χρήστες. Παρουσιάζεται ως επιλογή για αποθήκη δεδομένων μεγάλου μεγέθους καθώς χρειάζεται λιγότερος χρόνος και χρήματα για την κατασκευή. Ωστόσο, δεν υπάρχει τυπικός ορισμός του data mart που διαφέρει από άτομο σε άτομο.

Με απλά λόγια, το Data mart είναι θυγατρική μιας αποθήκης δεδομένων. Το data mart χρησιμοποιείται για το διαμέρισμα δεδομένων που δημιουργείται για τη συγκεκριμένη ομάδα χρηστών.

Τα δεδομένα mart θα μπορούσαν να δημιουργηθούν στην ίδια βάση δεδομένων με το Datawarehouse ή μια φυσικά ξεχωριστή βάση δεδομένων.

Βέλτιστες πρακτικές αρχιτεκτονικής αποθήκης δεδομένων

Για να σχεδιάσετε την Αρχιτεκτονική Data Warehouse, πρέπει να ακολουθήσετε τις παρακάτω βέλτιστες πρακτικές:

  • Χρησιμοποιήστε Μοντέλα Αποθήκης Δεδομένων που είναι βελτιστοποιημένα για ανάκτηση πληροφοριών που μπορεί να είναι η διαστατική λειτουργία, η αποδιαμόρφωση ή η υβριδική προσέγγιση.
  • Επιλέξτε την κατάλληλη προσέγγιση σχεδιασμού ως προσέγγιση από πάνω προς τα κάτω και από κάτω προς τα πάνω στο Data Warehouse
  • Πρέπει να βεβαιωθείτε ότι τα δεδομένα υποβάλλονται σε επεξεργασία γρήγορα και με ακρίβεια. Ταυτόχρονα, θα πρέπει να ακολουθήσετε μια προσέγγιση που ενοποιεί τα δεδομένα σε μια μοναδική έκδοση της αλήθειας.
  • Σχεδιάστε προσεκτικά τη διαδικασία απόκτησης και καθαρισμού δεδομένων για την αποθήκη δεδομένων.
  • Σχεδιάστε μια αρχιτεκτονική MetaData που επιτρέπει την κοινή χρήση μεταδεδομένων μεταξύ των στοιχείων της Data Warehouse
  • Εξετάστε το ενδεχόμενο εφαρμογής ενός μοντέλου ODS όταν η ανάγκη ανάκτησης πληροφοριών είναι κοντά στο κάτω μέρος της πυραμίδας αφαίρεσης δεδομένων ή όταν υπάρχουν πολλές λειτουργικές πηγές για πρόσβαση.
  • Θα πρέπει να βεβαιωθείτε ότι το μοντέλο δεδομένων είναι ενσωματωμένο και όχι μόνο ενοποιημένο. Σε αυτήν την περίπτωση, θα πρέπει να εξετάσετε το μοντέλο δεδομένων 3NF. Είναι επίσης ιδανικό για την απόκτηση ETL και εργαλείων καθαρισμού δεδομένων

Περίληψη:

  • Η αποθήκη δεδομένων είναι ένα σύστημα πληροφοριών που περιέχει ιστορικά και εναλλακτικά δεδομένα από μεμονωμένες ή πολλαπλές πηγές. Αυτές οι πηγές μπορεί να είναι παραδοσιακή αποθήκη δεδομένων, αποθήκη δεδομένων cloud ή αποθήκη εικονικών δεδομένων.
  • Η αποθήκη δεδομένων είναι προσανατολισμένη στο θέμα καθώς προσφέρει πληροφορίες σχετικά με το θέμα αντί για τις τρέχουσες δραστηριότητες του οργανισμού.
  • Στο Data Warehouse, ολοκλήρωση σημαίνει τη δημιουργία μιας κοινής μονάδας μέτρησης για όλα τα παρόμοια δεδομένα από τις διάφορες βάσεις δεδομένων
  • Η αποθήκη δεδομένων είναι επίσης ασταθής σημαίνει ότι τα προηγούμενα δεδομένα δεν διαγράφονται όταν εισάγονται νέα δεδομένα σε αυτήν.
  • Ένα Datawarehouse είναι Time-variant καθώς τα δεδομένα σε ένα DW έχουν υψηλή διάρκεια ζωής.
  • Υπάρχουν κυρίως 5 στοιχεία της αρχιτεκτονικής αποθήκης δεδομένων: 1) Βάση δεδομένων 2) Εργαλεία ETL 3) Μεταδεδομένα 4) Εργαλεία ερωτήσεων 5) DataMarts
  • Αυτές είναι τέσσερις κύριες κατηγορίες εργαλείων ερωτημάτων 1. Ερώτημα και αναφορά, εργαλεία 2. Εργαλεία ανάπτυξης εφαρμογών, 3. Εργαλεία εξόρυξης δεδομένων 4. Εργαλεία OLAP
  • Τα εργαλεία προέλευσης δεδομένων, μετατροπής και μετεγκατάστασης χρησιμοποιούνται για την εκτέλεση όλων των μετατροπών και των συνόψεων.
  • Στην Αρχιτεκτονική Data Warehouse, τα μετα-δεδομένα διαδραματίζουν σημαντικό ρόλο καθώς καθορίζει την πηγή, τη χρήση, τις τιμές και τα χαρακτηριστικά των δεδομένων αποθήκης δεδομένων.