Εποπτευόμενη Μηχανική Εκμάθηση: Τι είναι, Αλγόριθμοι, Παράδειγμα

Πίνακας περιεχομένων:

Anonim

Τι είναι η εποπτευόμενη μηχανική εκμάθηση;

Στην εποπτευόμενη εκμάθηση, εκπαιδεύετε το μηχάνημα χρησιμοποιώντας δεδομένα που είναι καλά "επισημασμένα ". Αυτό σημαίνει ότι ορισμένα δεδομένα έχουν ήδη επισημανθεί με τη σωστή απάντηση. Μπορεί να συγκριθεί με τη μάθηση που πραγματοποιείται παρουσία ενός επόπτη ή ενός δασκάλου.

Ένας εποπτευόμενος αλγόριθμος μάθησης μαθαίνει από τα δεδομένα εκπαίδευσης με ετικέτα, σας βοηθά να προβλέψετε τα αποτελέσματα για απρόβλεπτα δεδομένα.

Η επιτυχής κατασκευή, κλιμάκωση και ανάπτυξη ακριβών εποπτευόμενων μοντέλων μηχανικής μάθησης απαιτεί χρόνο και τεχνική εμπειρογνωμοσύνη από μια ομάδα ειδικευμένων επιστημόνων δεδομένων. Επιπλέον, ο επιστήμονας δεδομένων πρέπει να αναδημιουργήσει μοντέλα για να βεβαιωθεί ότι οι πληροφορίες που δίνονται παραμένουν αληθινές μέχρι να αλλάξουν τα δεδομένα του.

Σε αυτό το σεμινάριο, θα μάθετε:

  • Τι είναι η εποπτευόμενη μηχανική εκμάθηση;
  • Πώς λειτουργεί η εποπτευόμενη μάθηση
  • Τύποι αλγορίθμων εποπτευόμενης μηχανικής μάθησης
  • Τεχνικές εποπτευόμενης έναντι μη εποπτευόμενης μηχανικής εκμάθησης
  • Προκλήσεις στην εποπτευόμενη μηχανική μάθηση
  • Πλεονεκτήματα της εποπτευόμενης μάθησης:
  • Μειονεκτήματα της εποπτευόμενης μάθησης
  • Βέλτιστες πρακτικές για εποπτευόμενη μάθηση

Πώς λειτουργεί η εποπτευόμενη μάθηση

Για παράδειγμα, θέλετε να εκπαιδεύσετε ένα μηχάνημα για να σας βοηθήσει να προβλέψετε πόσο καιρό θα σας οδηγήσει στο σπίτι από το χώρο εργασίας σας. Εδώ, ξεκινάτε δημιουργώντας ένα σύνολο δεδομένων με ετικέτες. Αυτά τα δεδομένα περιλαμβάνουν

  • Καιρικές συνθήκες
  • Ωρα της ημέρας
  • Διακοπές

Όλες αυτές οι λεπτομέρειες είναι τα στοιχεία σας. Η έξοδος είναι ο χρόνος που χρειάστηκε για να επιστρέψετε στο σπίτι εκείνη τη συγκεκριμένη ημέρα.

Γνωρίζετε ενστικτωδώς ότι αν βρέχει έξω, θα σας πάρει περισσότερο χρόνο για να επιστρέψετε στο σπίτι. Αλλά το μηχάνημα χρειάζεται δεδομένα και στατιστικά στοιχεία.

Ας δούμε τώρα πώς μπορείτε να αναπτύξετε ένα εποπτευόμενο μοντέλο μάθησης αυτού του παραδείγματος που βοηθά τον χρήστη να καθορίσει τον χρόνο μετακίνησης. Το πρώτο πράγμα που πρέπει να δημιουργήσετε είναι ένα σετ προπόνησης. Αυτό το σετ προπόνησης θα περιέχει τον συνολικό χρόνο μετακίνησης και τους αντίστοιχους παράγοντες όπως ο καιρός, ο χρόνος κ.λπ. Με βάση αυτό το σετ προπόνησης, το μηχάνημά σας μπορεί να δει ότι υπάρχει άμεση σχέση μεταξύ του ποσού της βροχής και του χρόνου που θα χρειαστείτε για να φτάσετε στο σπίτι.

Έτσι, βεβαιώνεται ότι όσο περισσότερο βρέχει, τόσο περισσότερο θα οδηγείτε για να επιστρέψετε στο σπίτι σας. Μπορεί επίσης να δείτε τη σύνδεση μεταξύ της ώρας που αφήνετε τη δουλειά και της ώρας που θα βρίσκεστε στο δρόμο.

Όσο πιο κοντά βρίσκεστε στις 18:00, τόσο περισσότερο χρειάζεται για να φτάσετε στο σπίτι. Το μηχάνημά σας μπορεί να βρει μερικές από τις σχέσεις με τα δεδομένα σας που έχουν επισημανθεί.

Αυτή είναι η αρχή του μοντέλου δεδομένων σας. Αρχίζει να επηρεάζει τον τρόπο με τον οποίο η βροχή επηρεάζει τον τρόπο οδήγησης των ανθρώπων. Αρχίζει επίσης να βλέπει ότι περισσότεροι άνθρωποι ταξιδεύουν σε μια συγκεκριμένη ώρα της ημέρας.

Τύποι αλγορίθμων εποπτευόμενης μηχανικής μάθησης

Οπισθοδρόμηση:

Η τεχνική παλινδρόμησης προβλέπει μία τιμή εξόδου χρησιμοποιώντας δεδομένα εκπαίδευσης.

Παράδειγμα : Μπορείτε να χρησιμοποιήσετε παλινδρόμηση για να προβλέψετε την τιμή κατοικίας από τα δεδομένα εκπαίδευσης. Οι μεταβλητές εισόδου θα είναι η τοποθεσία, το μέγεθος ενός σπιτιού κ.λπ.

Πλεονεκτήματα : Οι έξοδοι έχουν πάντα μια πιθανή ερμηνεία και ο αλγόριθμος μπορεί να ρυθμιστεί για να αποφευχθεί η υπερβολική εφαρμογή.

Αδυναμίες : Η λογιστική παλινδρόμηση ενδέχεται να έχει χαμηλή απόδοση όταν υπάρχουν πολλαπλά ή μη γραμμικά όρια αποφάσεων. Αυτή η μέθοδος δεν είναι ευέλικτη, επομένως δεν συλλαμβάνει πολύπλοκες σχέσεις.

Λογιστική παλινδρόμηση:

Μέθοδος λογιστικής παλινδρόμησης που χρησιμοποιείται για την εκτίμηση διακριτών τιμών με βάση δεδομένο ένα σύνολο ανεξάρτητων μεταβλητών. Σας βοηθά να προβλέψετε την πιθανότητα εμφάνισης ενός συμβάντος προσαρμόζοντας δεδομένα σε μια συνάρτηση logit. Ως εκ τούτου, είναι επίσης γνωστό ως λογιστική παλινδρόμηση. Καθώς προβλέπει την πιθανότητα, η τιμή εξόδου της κυμαίνεται μεταξύ 0 και 1.

Ακολουθούν μερικοί τύποι αλγορίθμων παλινδρόμησης

Ταξινόμηση:

Ταξινόμηση σημαίνει ομαδοποίηση της εξόδου μέσα σε μια κλάση. Εάν ο αλγόριθμος προσπαθεί να επισημάνει είσοδο σε δύο διαφορετικές κατηγορίες, ονομάζεται δυαδική ταξινόμηση. Η επιλογή μεταξύ περισσότερων από δύο κατηγοριών αναφέρεται ως ταξινόμηση πολλαπλών κλάσεων.

Παράδειγμα : Προσδιορισμός του κατά πόσον κάποιος θα παραλείψει το δάνειο.

Πλεονεκτήματα : Το δέντρο ταξινόμησης αποδίδει πολύ καλά στην πράξη

Αδυναμίες : Χωρίς περιορισμούς, μεμονωμένα δέντρα είναι επιρρεπή σε υπερβολική τοποθέτηση.

Ακολουθούν μερικοί τύποι αλγορίθμων ταξινόμησης

Naïve Bayes Classifiers

Το μοντέλο Naïve Bayesian (NBN) είναι εύκολο στη δημιουργία και είναι πολύ χρήσιμο για μεγάλα σύνολα δεδομένων. Αυτή η μέθοδος αποτελείται από άμεσα ακυκλικά γραφήματα με έναν γονέα και πολλά παιδιά. Υποθέτει ανεξαρτησία μεταξύ των θυγατρικών κόμβων που διαχωρίζονται από τον γονέα τους.

Δέντρα απόφασης

Οι αποφάσεις δέντρα ταξινομούν την παρουσία ταξινομώντας τις με βάση την τιμή της δυνατότητας. Σε αυτήν τη μέθοδο, κάθε λειτουργία είναι το χαρακτηριστικό μιας παρουσίας. Θα πρέπει να ταξινομηθεί και κάθε κλάδος αντιπροσωπεύει μια τιμή την οποία ο κόμβος μπορεί να αναλάβει. Είναι μια ευρέως χρησιμοποιούμενη τεχνική ταξινόμησης. Σε αυτήν τη μέθοδο, η ταξινόμηση είναι ένα δέντρο που είναι γνωστό ως δέντρο αποφάσεων.

Σας βοηθά να εκτιμήσετε τις πραγματικές τιμές (κόστος αγοράς αυτοκινήτου, αριθμός κλήσεων, συνολικές μηνιαίες πωλήσεις κ.λπ.).

Υποστήριξη διανυσματική μηχανή

Το Support vector machine (SVM) είναι ένας τύπος αλγορίθμου εκμάθησης που αναπτύχθηκε το 1990. Αυτή η μέθοδος βασίζεται σε αποτελέσματα από τη θεωρία της στατιστικής μάθησης που εισήγαγε ο Vap Nik.

Οι μηχανές SVM συνδέονται επίσης στενά με λειτουργίες πυρήνα, η οποία αποτελεί κεντρική ιδέα για τις περισσότερες από τις μαθησιακές εργασίες. Το πλαίσιο του πυρήνα και το SVM χρησιμοποιούνται σε διάφορα πεδία. Περιλαμβάνει ανάκτηση πληροφοριών πολυμέσων, βιοπληροφορική και αναγνώριση προτύπων.

Τεχνικές εποπτευόμενης έναντι μη εποπτευόμενης μηχανικής εκμάθησης

Βασισμένο στο Εποπτευόμενη τεχνική μηχανικής μάθησης Μη επιτηρούμενη τεχνική μηχανικής μάθησης
Εισαγωγή δεδομένων Οι αλγόριθμοι εκπαιδεύονται χρησιμοποιώντας ετικέτες δεδομένων. Οι αλγόριθμοι χρησιμοποιούνται σε δεδομένα που δεν φέρουν ετικέτα
Υπολογιστική πολυπλοκότητα Η εποπτευόμενη μάθηση είναι μια απλούστερη μέθοδος. Η μη επιτηρούμενη μάθηση είναι υπολογιστικά περίπλοκη
Ακρίβεια Πολύ ακριβής και αξιόπιστη μέθοδος. Λιγότερο ακριβής και αξιόπιστη μέθοδος.

Προκλήσεις στην εποπτευόμενη μηχανική μάθηση

Εδώ, αντιμετωπίζονται προκλήσεις στην εποπτευόμενη μηχανική μάθηση:

  • Άσχετα χαρακτηριστικά γνωρίσματα εισαγωγής δεδομένων κατάρτισης θα μπορούσαν να δώσουν ανακριβή αποτελέσματα
  • Η προετοιμασία και η προεπεξεργασία δεδομένων είναι πάντα μια πρόκληση.
  • Η ακρίβεια υποφέρει όταν είναι αδύνατο, απίθανο και ελλιπείς τιμές έχουν εισαχθεί ως δεδομένα εκπαίδευσης
  • Εάν ο ενδιαφερόμενος εμπειρογνώμονας δεν είναι διαθέσιμος, τότε η άλλη προσέγγιση είναι η «ωμή βία». Αυτό σημαίνει ότι πρέπει να σκεφτείτε ότι τα σωστά χαρακτηριστικά (μεταβλητές εισόδου) για να εκπαιδεύσετε το μηχάνημα. Θα μπορούσε να είναι ανακριβές.

Πλεονεκτήματα της εποπτευόμενης μάθησης:

  • Η εποπτευόμενη εκμάθηση σάς επιτρέπει να συλλέγετε δεδομένα ή να παράγετε δεδομένα εξόδου από την προηγούμενη εμπειρία
  • Σας βοηθά να βελτιστοποιήσετε τα κριτήρια απόδοσης χρησιμοποιώντας την εμπειρία
  • Η εποπτευόμενη μηχανική μάθηση σάς βοηθά να επιλύσετε διάφορους τύπους προβλημάτων υπολογισμού πραγματικού κόσμου.

Μειονεκτήματα της εποπτευόμενης μάθησης

  • Το όριο των αποφάσεων μπορεί να είναι υπερβολικό εάν το σετ προπόνησής σας που δεν έχει παραδείγματα που θέλετε να έχετε σε μια τάξη
  • Πρέπει να επιλέξετε πολλά καλά παραδείγματα από κάθε τάξη ενώ εκπαιδεύετε τον ταξινομητή.
  • Η ταξινόμηση μεγάλων δεδομένων μπορεί να είναι μια πραγματική πρόκληση.
  • Η κατάρτιση για εποπτευόμενη μάθηση χρειάζεται πολύ χρόνο υπολογισμού.

Βέλτιστες πρακτικές για εποπτευόμενη μάθηση

  • Πριν κάνετε οτιδήποτε άλλο, πρέπει να αποφασίσετε τι είδους δεδομένα πρόκειται να χρησιμοποιηθούν ως εκπαιδευτικό σύνολο
  • Πρέπει να αποφασίσετε τη δομή της μαθημένης λειτουργίας και του αλγορίθμου εκμάθησης.
  • Gathere αντίστοιχες εξόδους είτε από εμπειρογνώμονες του ανθρώπου είτε από μετρήσεις

Περίληψη

  • Στην εποπτευόμενη εκμάθηση, εκπαιδεύετε το μηχάνημα χρησιμοποιώντας δεδομένα που είναι καλά "επισημασμένα".
  • Θέλετε να εκπαιδεύσετε ένα μηχάνημα που θα σας βοηθήσει να προβλέψετε πόσο καιρό θα σας οδηγήσει στο σπίτι από το χώρο εργασίας σας είναι ένα παράδειγμα εποπτευόμενης μάθησης
  • Η παλινδρόμηση και η ταξινόμηση είναι δύο τύποι εποπτευόμενων τεχνικών μηχανικής μάθησης.
  • Η εποπτευόμενη μάθηση είναι μια απλούστερη μέθοδος, ενώ η μη εποπτευόμενη μάθηση είναι μια πολύπλοκη μέθοδος.
  • Η μεγαλύτερη πρόκληση στην εποπτευόμενη μάθηση είναι ότι τα άσχετα στοιχεία εισαγωγής που παρουσιάζουν τα εκπαιδευτικά δεδομένα θα μπορούσαν να δώσουν ανακριβή αποτελέσματα.
  • Το κύριο πλεονέκτημα της εποπτευόμενης μάθησης είναι ότι σας επιτρέπει να συλλέγετε δεδομένα ή να παράγετε δεδομένα εξόδου από την προηγούμενη εμπειρία.
  • Το μειονέκτημα αυτού του μοντέλου είναι ότι το όριο των αποφάσεων μπορεί να είναι υπερβολικό εάν το σετ προπόνησής σας δεν έχει παραδείγματα που θέλετε να έχετε σε μια τάξη.
  • Ως βέλτιστη πρακτική επίβλεψης της μάθησης, πρέπει πρώτα να αποφασίσετε τι είδους δεδομένα πρέπει να χρησιμοποιούνται ως εκπαιδευτικό σύνολο.