Μη εποπτευόμενη μηχανική εκμάθηση: Τι είναι, αλγόριθμοι, παράδειγμα

Πίνακας περιεχομένων:

Anonim

Μη εποπτευόμενη μάθηση

Η μη εποπτευόμενη μάθηση είναι μια τεχνική μηχανικής μάθησης στην οποία οι χρήστες δεν χρειάζεται να επιβλέπουν το μοντέλο. Αντίθετα, επιτρέπει στο μοντέλο να δουλεύει μόνος του για να ανακαλύπτει μοτίβα και πληροφορίες που προηγουμένως δεν είχαν εντοπιστεί. Ασχολείται κυρίως με τα μη επισημασμένα δεδομένα.

Μη εποπτευόμενοι αλγόριθμοι μάθησης

Οι μη επιτηρημένοι μαθησιακοί αλγόριθμοι επιτρέπουν στους χρήστες να εκτελούν πιο πολύπλοκες εργασίες επεξεργασίας σε σύγκριση με την εποπτευόμενη μάθηση. Αν και, η μη επιτηρούμενη μάθηση μπορεί να είναι πιο απρόβλεπτη σε σύγκριση με άλλες φυσικές μεθόδους μάθησης. Οι μη επιτηρούμενοι αλγόριθμοι μάθησης περιλαμβάνουν ομαδοποίηση, ανίχνευση ανωμαλιών, νευρωνικά δίκτυα κ.λπ.

Σε αυτό το σεμινάριο, θα μάθετε:

  • Παράδειγμα Μη Επιτηρούμενης Μηχανικής Μάθησης
  • Γιατί μη επιτηρούμενη μάθηση;
  • Τύποι μη εποπτευόμενης μάθησης
  • Ομαδοποίηση
  • Τύποι ομαδοποίησης
  • Σχέση
  • Μηχανική εκμάθηση με επίβλεψη και χωρίς επίβλεψη
  • Εφαρμογές μη εποπτευόμενης μηχανικής μάθησης
  • Μειονεκτήματα της μη εποπτευόμενης μάθησης

Παράδειγμα Μη Επιτηρούμενης Μηχανικής Μάθησης

Ας πάρουμε την περίπτωση ενός μωρού και του οικογενειακού σκύλου της.

Ξέρει και ταυτοποιεί αυτόν τον σκύλο. Λίγες εβδομάδες αργότερα, ένας φίλος της οικογένειας φέρνει μαζί του ένα σκυλί και προσπαθεί να παίξει με το μωρό.

Το μωρό δεν έχει δει αυτό το σκυλί νωρίτερα. Αλλά αναγνωρίζει ότι πολλά χαρακτηριστικά (2 αυτιά, μάτια, περπάτημα με 4 πόδια) είναι σαν το κατοικίδιο σκύλο της. Προσδιορίζει το νέο ζώο ως σκύλο. Πρόκειται για μια μη επιτηρούμενη μάθηση, όπου δεν διδάσκεστε, αλλά μαθαίνετε από τα δεδομένα (σε αυτήν την περίπτωση τα δεδομένα για έναν σκύλο.) Εάν αυτό ήταν επιτηρούμενη μάθηση, ο φίλος της οικογένειας θα είχε πει στο μωρό ότι είναι σκύλος.

Γιατί μη επιτηρούμενη μάθηση;

Εδώ είναι οι βασικοί λόγοι για τη χρήση της μη εποπτευόμενης μάθησης:

  • Η μη επιτηρούμενη μηχανική μάθηση βρίσκει κάθε είδους άγνωστα μοτίβα στα δεδομένα.
  • Οι μη εποπτευόμενες μέθοδοι σας βοηθούν να βρείτε δυνατότητες που μπορούν να είναι χρήσιμες για την κατηγοριοποίηση.
  • Πραγματοποιείται σε πραγματικό χρόνο, έτσι ώστε όλα τα δεδομένα εισαγωγής να αναλύονται και να επισημαίνονται παρουσία εκπαιδευομένων.
  • Είναι πιο εύκολο να λαμβάνετε δεδομένα χωρίς ετικέτα από έναν υπολογιστή από ό, τι τα δεδομένα με ετικέτα, τα οποία χρειάζονται χειροκίνητη παρέμβαση.

Τύποι μη εποπτευόμενης μάθησης

Τα μη επιτηρούμενα μαθησιακά προβλήματα ομαδοποιήθηκαν περαιτέρω σε προβλήματα ομαδοποίησης και συσχέτισης.

Ομαδοποίηση

Η ομαδοποίηση είναι μια σημαντική ιδέα όταν πρόκειται για μη εποπτευόμενη μάθηση. Ασχολείται κυρίως με την εύρεση δομής ή μοτίβου σε μια συλλογή δεδομένων που δεν έχουν κατηγοριοποιηθεί. Οι αλγόριθμοι συμπλέγματος θα επεξεργαστούν τα δεδομένα σας και θα βρουν φυσικά συμπλέγματα (ομάδες) εάν υπάρχουν στα δεδομένα. Μπορείτε επίσης να τροποποιήσετε πόσα συμπλέγματα πρέπει να προσδιορίσουν οι αλγόριθμοί σας. Σας επιτρέπει να προσαρμόσετε την ευαισθησία αυτών των ομάδων.

Υπάρχουν διάφοροι τύποι ομαδοποίησης που μπορείτε να χρησιμοποιήσετε:

Αποκλειστικό (διαμέριση)

Σε αυτήν τη μέθοδο ομαδοποίησης, τα δεδομένα ομαδοποιούνται με τέτοιο τρόπο ώστε ένα δεδομένα να μπορεί να ανήκει μόνο σε ένα σύμπλεγμα.

Παράδειγμα: Κ-μέσα

Συγκεντρωτικά

Σε αυτήν την τεχνική ομαδοποίησης, κάθε δεδομένα είναι ένα σύμπλεγμα. Οι επαναλαμβανόμενες ενώσεις μεταξύ των δύο κοντινότερων συστάδων μειώνουν τον αριθμό των συστάδων.

Παράδειγμα: Ιεραρχική ομαδοποίηση

Επικάλυψη

Σε αυτήν την τεχνική, τα ασαφή σύνολα χρησιμοποιούνται για τη συγκέντρωση δεδομένων. Κάθε σημείο μπορεί να ανήκει σε δύο ή περισσότερα σμήνη με ξεχωριστούς βαθμούς συμμετοχής.

Εδώ, τα δεδομένα θα συσχετιστούν με μια κατάλληλη τιμή ιδιότητας μέλους. Παράδειγμα: Ασαφές C-Μέσα

Πιθανοτική

Αυτή η τεχνική χρησιμοποιεί κατανομή πιθανότητας για τη δημιουργία συστάδων

Παράδειγμα: Ακολουθώντας λέξεις-κλειδιά

  • "Ανδρικό παπούτσι."
  • "γυναικείο παπούτσι."
  • γυναικείο γάντι. "
  • "γάντι του άνδρα."

μπορεί να συγκεντρωθεί σε δύο κατηγορίες "παπούτσι" και "γάντι" ή "άνδρας" και "γυναίκες".

Τύποι ομαδοποίησης

  • Ιεραρχική ομαδοποίηση
  • Κ-σημαίνει ομαδοποίηση
  • K-NN (k πλησιέστεροι γείτονες)
  • Ανάλυση κύριων συστατικών
  • Μοναδική Αποσύνθεση Αξίας
  • Ανεξάρτητη ανάλυση συστατικών

Ιεραρχική ομαδοποίηση:

Η ιεραρχική ομαδοποίηση είναι ένας αλγόριθμος που δημιουργεί μια ιεραρχία συστάδων. Ξεκινά με όλα τα δεδομένα που έχουν αντιστοιχιστεί σε ένα δικό τους σύμπλεγμα. Εδώ, δύο στενά σύμπλεγμα πρόκειται να βρίσκονται στο ίδιο σύμπλεγμα. Αυτός ο αλγόριθμος τελειώνει όταν απομένει μόνο ένα σύμπλεγμα.

Κ-σημαίνει Ομαδοποίηση

Το K σημαίνει ότι είναι ένας επαναληπτικός αλγόριθμος ομαδοποίησης που σας βοηθά να βρείτε την υψηλότερη τιμή για κάθε επανάληψη. Αρχικά, επιλέγεται ο επιθυμητός αριθμός συστάδων. Σε αυτήν τη μέθοδο ομαδοποίησης, πρέπει να ομαδοποιήσετε τα σημεία δεδομένων σε ομάδες k. Ένα μεγαλύτερο k σημαίνει μικρότερες ομάδες με περισσότερη ευκρίνεια με τον ίδιο τρόπο. Το κατώτερο k σημαίνει μεγαλύτερες ομάδες με λιγότερη ευκρίνεια.

Η έξοδος του αλγορίθμου είναι μια ομάδα "ετικετών". Εκχωρεί σημείο δεδομένων σε μία από τις ομάδες k. Στην ομαδοποίηση k-σημαίνει, κάθε ομάδα ορίζεται δημιουργώντας ένα κεντροειδές για κάθε ομάδα. Τα κεντροειδή είναι σαν την καρδιά του συμπλέγματος, το οποίο συλλαμβάνει τα σημεία που βρίσκονται πλησιέστερα σε αυτά και τα προσθέτει στο σύμπλεγμα.

Η σύμπλεξη K-mean ορίζει περαιτέρω δύο υποομάδες:

  • Συγκεντρωτική ομαδοποίηση
  • Δενδρογράφημα

Συγκεντρωτική συγκέντρωση:

Αυτός ο τύπος συμπλέγματος K-σημαίνει ξεκινά με έναν καθορισμένο αριθμό συστάδων. Εκχωρεί όλα τα δεδομένα στον ακριβή αριθμό συστάδων. Αυτή η μέθοδος ομαδοποίησης δεν απαιτεί τον αριθμό των συστάδων Κ ως είσοδο. Η διαδικασία συσσωμάτωσης ξεκινά σχηματίζοντας κάθε δεδομένα ως ένα ενιαίο σύμπλεγμα.

Αυτή η μέθοδος χρησιμοποιεί κάποιο μέτρο απόστασης, μειώνει τον αριθμό των συστάδων (μία σε κάθε επανάληψη) με τη διαδικασία συγχώνευσης. Τέλος, έχουμε ένα μεγάλο σύμπλεγμα που περιέχει όλα τα αντικείμενα.

Δενδρογράφημα:

Στη μέθοδο συμπλέγματος Dendrogram, κάθε επίπεδο θα αντιπροσωπεύει ένα πιθανό σύμπλεγμα. Το ύψος του δενδρογράμματος δείχνει το επίπεδο ομοιότητας μεταξύ δύο συμπλεγμάτων. Όσο πιο κοντά στο κάτω μέρος της διαδικασίας είναι πιο παρόμοιο σύμπλεγμα το οποίο βρίσκει την ομάδα από δενδρογράφημα που δεν είναι φυσικό και ως επί το πλείστον υποκειμενικό.

Κ- Κοντινότεροι γείτονες

Ο πλησιέστερος γείτονας είναι ο απλούστερος από όλους τους ταξινομητές μηχανικής μάθησης. Διαφέρει από άλλες τεχνικές μηχανικής εκμάθησης, καθώς δεν παράγει μοντέλο. Είναι ένας απλός αλγόριθμος που αποθηκεύει όλες τις διαθέσιμες περιπτώσεις και ταξινομεί νέες παρουσίες βάσει ενός μέτρου ομοιότητας.

Λειτουργεί πολύ καλά όταν υπάρχει απόσταση μεταξύ παραδειγμάτων. Η ταχύτητα εκμάθησης είναι αργή όταν το σετ προπόνησης είναι μεγάλο και ο υπολογισμός απόστασης είναι ασυνήθιστος.

Ανάλυση κύριων συστατικών:

Σε περίπτωση που θέλετε ένα υψηλότερο διαστάσεων χώρο. Πρέπει να επιλέξετε μια βάση για αυτόν τον χώρο και μόνο τις 200 πιο σημαντικές βαθμολογίες αυτής της βάσης. Αυτή η βάση είναι γνωστή ως βασικό συστατικό. Το υποσύνολο που επιλέγετε είναι ένας νέος χώρος που έχει μικρό μέγεθος σε σύγκριση με τον αρχικό χώρο. Διατηρεί όσο το δυνατόν περισσότερη πολυπλοκότητα δεδομένων.

Σχέση

Οι κανόνες συσχέτισης σάς επιτρέπουν να δημιουργήσετε συσχετισμούς μεταξύ αντικειμένων δεδομένων μέσα σε μεγάλες βάσεις δεδομένων. Αυτή η τεχνική χωρίς επίβλεψη αφορά την ανακάλυψη ενδιαφέρων σχέσεων μεταξύ μεταβλητών σε μεγάλες βάσεις δεδομένων. Για παράδειγμα, οι άνθρωποι που αγοράζουν ένα νέο σπίτι πιθανότατα να αγοράσουν νέα έπιπλα.

Άλλα παραδείγματα:

  • Μια υποομάδα καρκινοπαθών ομαδοποιημένων με τις μετρήσεις έκφρασης γονιδίων
  • Ομάδες αγοραστών βάσει του ιστορικού περιήγησής τους και αγορών
  • Ομάδα ταινιών κατά την βαθμολογία που δίνουν οι θεατές ταινιών

Μηχανική εκμάθηση με επίβλεψη και χωρίς επίβλεψη

Παράμετροι Εποπτευόμενη τεχνική μηχανικής μάθησης Μη επιτηρούμενη τεχνική μηχανικής μάθησης
Εισαγωγή δεδομένων Οι αλγόριθμοι εκπαιδεύονται χρησιμοποιώντας ετικέτες δεδομένων. Οι αλγόριθμοι χρησιμοποιούνται σε δεδομένα που δεν φέρουν ετικέτα
Υπολογιστική πολυπλοκότητα Η εποπτευόμενη μάθηση είναι μια απλούστερη μέθοδος. Η μη επιτηρούμενη μάθηση είναι υπολογιστικά περίπλοκη
Ακρίβεια Πολύ ακριβής και αξιόπιστη μέθοδος. Λιγότερο ακριβής και αξιόπιστη μέθοδος.

Εφαρμογές μη εποπτευόμενης μηχανικής μάθησης

Ορισμένες εφαρμογές μη εποπτευόμενων τεχνικών μηχανικής μάθησης είναι:

  • Η ομαδοποίηση χωρίζει αυτόματα το σύνολο δεδομένων σε ομάδες με βάση τις ομοιότητές τους
  • Η ανίχνευση ανωμαλιών μπορεί να ανακαλύψει ασυνήθιστα σημεία δεδομένων στο σύνολο δεδομένων σας. Είναι χρήσιμο για την εύρεση δόλιων συναλλαγών
  • Η εξόρυξη συσχέτισης προσδιορίζει σύνολα στοιχείων που εμφανίζονται συχνά μαζί στο σύνολο δεδομένων σας
  • Τα μοντέλα λανθάνουσας μεταβλητής χρησιμοποιούνται ευρέως για την προεπεξεργασία δεδομένων. Όπως η μείωση του αριθμού των χαρακτηριστικών σε ένα σύνολο δεδομένων ή η αποσύνθεση του συνόλου δεδομένων σε πολλά στοιχεία

Μειονεκτήματα της μη εποπτευόμενης μάθησης

  • Δεν μπορείτε να λάβετε ακριβείς πληροφορίες σχετικά με την ταξινόμηση δεδομένων και η έξοδος καθώς τα δεδομένα που χρησιμοποιούνται στη μη εποπτευόμενη μάθηση επισημαίνονται και δεν είναι γνωστά
  • Η λιγότερη ακρίβεια των αποτελεσμάτων είναι επειδή τα δεδομένα εισαγωγής δεν είναι γνωστά και δεν επισημαίνονται εκ των προτέρων από άτομα. Αυτό σημαίνει ότι το μηχάνημα πρέπει να το κάνει μόνο του.
  • Οι φασματικές τάξεις δεν αντιστοιχούν πάντα σε ενημερωτικές τάξεις.
  • Ο χρήστης πρέπει να αφιερώσει χρόνο στην ερμηνεία και την επισήμανση των κλάσεων που ακολουθούν αυτήν την ταξινόμηση.
  • Οι φασματικές ιδιότητες των τάξεων μπορούν επίσης να αλλάξουν με την πάροδο του χρόνου, ώστε να μην μπορείτε να έχετε τις ίδιες πληροφορίες τάξης ενώ μετακινείτε από τη μία εικόνα στην άλλη.

Περίληψη

  • Η μη επιτηρούμενη μάθηση είναι μια τεχνική μηχανικής εκμάθησης, όπου δεν χρειάζεται να επιβλέπετε το μοντέλο.
  • Η μη εποπτευόμενη μηχανική εκμάθηση σάς βοηθά να βρίσκετε κάθε είδους άγνωστα μοτίβα στα δεδομένα.
  • Η ομαδοποίηση και η σύνδεση είναι δύο τύποι μη εποπτευόμενης μάθησης.
  • Τέσσερις τύποι μεθόδων ομαδοποίησης είναι 1) Αποκλειστικός 2) Συγκεντρωτικός 3) Επικαλυπτόμενος 4) Πιθανός.
  • Σημαντικοί τύποι ομαδοποίησης είναι: 1) Ιεραρχική ομαδοποίηση 2) ​​Ομαδοποίηση Κ-μέσων 3) Κ-ΝΝ 4) Ανάλυση κύριων συστατικών 5) Αποσύνθεση μοναδικής τιμής 6) Ανάλυση ανεξάρτητων συστατικών.
  • Οι κανόνες συσχέτισης σάς επιτρέπουν να δημιουργήσετε συσχετισμούς μεταξύ αντικειμένων δεδομένων μέσα σε μεγάλες βάσεις δεδομένων.
  • Στην εποπτευόμενη εκμάθηση, οι αλγόριθμοι εκπαιδεύονται με χρήση ετικετών δεδομένων, ενώ στην μη εποπτευόμενη μάθηση οι αλγόριθμοι χρησιμοποιούνται έναντι δεδομένων που δεν φέρουν ετικέτα.
  • Η ανίχνευση ανωμαλιών μπορεί να ανακαλύψει σημαντικά σημεία δεδομένων στο σύνολο δεδομένων σας, τα οποία είναι χρήσιμα για την εύρεση δόλιων συναλλαγών.
  • Το μεγαλύτερο μειονέκτημα της μη εποπτευόμενης μάθησης είναι ότι δεν μπορείτε να λάβετε ακριβείς πληροφορίες σχετικά με την ταξινόμηση δεδομένων.