Ο Μετασχηματισμός Κανονικοποιητή στην Πληροφορική με ΠΑΡΑΔΕΙΓΜΑ

Anonim
Τι είναι ο Μετασχηματισμός Normalizer;

Ο Normalizer είναι ένας ενεργός μετασχηματισμός, που χρησιμοποιείται για τη μετατροπή μιας γραμμής σε πολλές σειρές και το αντίστροφο. Είναι ένας έξυπνος τρόπος αναπαραγωγής των δεδομένων σας με πιο οργανωμένο τρόπο.

Εάν σε μία σειρά υπάρχουν επαναλαμβανόμενα δεδομένα σε πολλές στήλες, τότε μπορεί να χωριστεί σε πολλές σειρές. Μερικές φορές έχουμε δεδομένα σε πολλές στήλες. Για παράδειγμα

Ονομα μαθητή Βαθμολογία 9ης τάξης Βαθμολογία τάξης 10 Βαθμολογία τάξης 11 Βαθμολογία τάξης 12
Μαθητής 1 50 60 65 80
Μαθητής 2 70 64 83 77

Σε αυτήν την περίπτωση, η στήλη βαθμολογίας κλάσης επαναλαμβάνεται σε τέσσερις στήλες. Χρησιμοποιώντας το κανονικοποιητή, μπορούμε να τα χωρίσουμε στο ακόλουθο σύνολο δεδομένων.

Ονομα μαθητή Τάξη Σκορ
Μαθητής 1 9 50
Μαθητής 1 10 60
Μαθητής 1 11 65
Μαθητής 1 12 80
Μαθητής 2 9 70
Μαθητής 2 10 64
Μαθητής 2 11 83
Μαθητής 2 12 77

Βήμα 1 - Δημιουργήστε τον πίνακα προέλευσης "sales_source" και τον πίνακα στόχου "sales_target" χρησιμοποιώντας το σενάριο και εισαγάγετέ τα στο Informatica

Πραγματοποιήστε λήψη του παραπάνω αρχείου Sales_Source.txt

Βήμα 2 - Δημιουργήστε μια αντιστοίχιση με πηγή "sales_source" και πίνακα στόχου "sales_target"

Βήμα 3 - Από το μενού μετασχηματισμού δημιουργήστε έναν νέο μετασχηματισμό

  1. Επιλέξτε κανονικοποίηση ως μετασχηματισμό
  2. Εισαγάγετε όνομα, "nrm_sales"
  3. Επιλέξτε δημιουργία

Βήμα 4 - Ο μετασχηματισμός θα δημιουργηθεί, επιλέξτε επιλογή

Βήμα 5 - Στη συνέχεια, κάντε διπλό κλικ στον μετασχηματισμό κανονικοποίησης

  1. Επιλέξτε καρτέλα κανονικοποίησης
  2. Κάντε κλικ στο εικονίδιο για να δημιουργήσετε δύο στήλες
  3. Εισαγάγετε ονόματα στηλών
  4. Ορίστε τον αριθμό εμφάνισης σε 4 για πωλήσεις και 0 για το όνομα καταστήματος
  5. Επιλέξτε το κουμπί ΟΚ

Οι στήλες θα δημιουργηθούν κατά τη μετατροπή. Θα δείτε 4 στήλη πωλήσεων καθώς ορίζουμε τον αριθμό εμφανίσεων σε 4.

Βήμα 6 - Στη συνέχεια στη χαρτογράφηση

  1. Συνδέστε τις τέσσερις στήλες του προσδιοριστή πηγής του τετάρτου τριμήνου με τις στήλες κανονικοποίησης αντίστοιχα.
  2. Συνδέστε τη στήλη ονόματος καταστήματος με τη στήλη κανονικοποίησης
  3. Συνδέστε τις στήλες store_name & sales από τον κανονικοποιητή στον πίνακα στόχων
  4. Συνδέστε τη στήλη GK_sales από το κανονικοποιητή στον πίνακα στόχου

Αποθηκεύστε τη χαρτογράφηση και εκτελέστε την μετά τη δημιουργία περιόδου λειτουργίας και ροής εργασίας. Για κάθε τρίμηνο πωλήσεις ενός καταστήματος, θα δημιουργηθεί μια ξεχωριστή σειρά από τον μετασχηματισμό κανονικοποίησης.

Το αποτέλεσμα της χαρτογράφησής μας θα είναι όπως -

Όνομα καταστήματος Τέταρτο Εκπτώσεις
ΔΕΛΧΙ 1 150
ΔΕΛΧΙ 2 240
ΔΕΛΧΙ 3 455
ΔΕΛΧΙ 4 100
ΜΟΥΜΠΑΙ 1 100
ΜΟΥΜΠΑΙ 2 500
ΜΟΥΜΠΑΙ 3 350
ΜΟΥΜΠΑΙ 4 340

Τα δεδομένα προέλευσης είχαν επαναλαμβανόμενες στήλες, δηλαδή QUARTER1, QUARTER2, QUARTER3 και QUARTER4. Με τη βοήθεια του κανονικοποιητή, έχουμε αναδιατάξει τα δεδομένα ώστε να χωρέσουν σε μία στήλη του QUARTER και για μια εγγραφή πηγής δημιουργούνται τέσσερις εγγραφές στο στόχο.

Με αυτόν τον τρόπο, μπορείτε να ομαλοποιήσετε τα δεδομένα και να δημιουργήσετε πολλές εγγραφές για μία μόνο πηγή δεδομένων.