Πίνακας περιεχομένων:

Ανάλυση κύριου στοιχείου: 4 βήματα
Ανάλυση κύριου στοιχείου: 4 βήματα

Βίντεο: Ανάλυση κύριου στοιχείου: 4 βήματα

Βίντεο: Ανάλυση κύριου στοιχείου: 4 βήματα
Βίντεο: Δωρεάν webinar για την ψηφιακή κάρτα εργασίας από το Taxheaven και την Epsilon Net 2024, Νοέμβριος
Anonim
Ανάλυση κύριων στοιχείων
Ανάλυση κύριων στοιχείων

Η κύρια ανάλυση συστατικών στοιχείων είναι μια στατιστική μέθοδος που μετατρέπει ένα σύνολο πιθανώς συσχετισμένων μεταβλητών σε ένα σύνολο γραμμικά μη συσχετισμένων τιμών χρησιμοποιώντας ορθογώνιους μετασχηματισμούς. Με απλές λέξεις που δίνεται ένα σύνολο δεδομένων με πολλαπλές διαστάσεις, βοηθά στη μείωση του αριθμού των διαστάσεων, καθιστώντας έτσι ευκολότερη την ανάγνωση των δεδομένων.

Βήμα 1: Αρχικά σχέδια

Iρθα σε αυτήν την τάξη με την ιδέα ότι ήθελα να καταλάβω και ελπίζω να γράψω έναν αλγόριθμο που θα είναι σε θέση να εκτελέσει αναγνώριση προσώπου όταν παρέχεται με εικόνες. Δεν είχα προηγούμενη εμπειρία ή γνώση για οτιδήποτε είχε να κάνει με την αναγνώριση προσώπου και δεν είχα ιδέα πόσο δύσκολο είναι να επιτύχει κάτι τέτοιο. Αφού μίλησα με τον καθηγητή Malloch συνειδητοποίησα ότι πρέπει να μάθω πολλά πράγματα προτού μπορέσω να κατανοήσω πλήρως το έργο που τελικά σχεδίασα να επιτύχω.

Μετά από λίγη έρευνα, τελικά αποφάσισα ότι περισσότερο από οτιδήποτε χρειαζόμουν για να μάθω γραμμική άλγεβρα και ορισμένα βασικά της μηχανικής μάθησης και ασχολήθηκα με το PCA (ανάλυση κύριας συνιστώσας) για να είμαι ο στόχος μου για αυτήν την τάξη.

Βήμα 2: Έρευνα

Ερευνα
Ερευνα

Το πρώτο βήμα ήταν να επισκεφθώ τη Βιβλιοθήκη και να βρω οποιοδήποτε βιβλίο που με εισήγαγε στη μηχανική μάθηση και πιο συγκεκριμένα στην επεξεργασία εικόνας. Αυτό αποδείχθηκε πολύ πιο δύσκολο από όσο νόμιζα και δεν κατέληξα σε τίποτα από αυτό. Τότε αποφάσισα να ρωτήσω έναν φίλο που εργαζόταν στο Vision Lab που μου ζήτησε να εξετάσω τη γραμμική άλγεβρα και πιο συγκεκριμένα τα ιδιοδιανύσματα και τις ιδιοτιμές. Είχα κάποια εμπειρία με την γραμμική άλγεβρα από μια τάξη που είχα παρακολουθήσει στο δεύτερο έτος, αλλά δεν κατάλαβα πώς τα ιδιοδιανύσματα ή οι ιδιοτιμές θα μπορούσαν να είναι χρήσιμα όταν ασχολούμαστε με εικόνες. Καθώς ερεύνησα περισσότερο κατάλαβα ότι οι εικόνες δεν ήταν παρά τεράστια σύνολα δεδομένων και ως εκ τούτου θα μπορούσαν να αντιμετωπιστούν ως πίνακες και μου έγινε λίγο πιο σαφές γιατί οι ιδιοδιανύσματα σχετίζονται με αυτό που έκανα. Σε αυτό το σημείο, αποφάσισα ότι πρέπει να μάθω πώς να διαβάζω εικόνες χρησιμοποιώντας python καθώς επρόκειτο να χρησιμοποιήσω python για το έργο μου. Αρχικά, ξεκίνησα χρησιμοποιώντας το CV2.imread για να διαβάσω τις εικόνες αλλά αυτό αποδείχθηκε πολύ αργό και ως εκ τούτου αποφάσισα να χρησιμοποιήσω το glob και το PIL.image.open για να το κάνω καθώς αυτό είναι πολύ πιο γρήγορο. Αυτή η διαδικασία στο χαρτί φαίνεται σχετικά χρονοβόρα, αλλά στην πραγματικότητα πήρε αρκετό χρόνο καθώς έπρεπε να μάθω πώς να εγκαθιστώ και να εισάγω διαφορετικές βιβλιοθήκες στο PyCharm (IDE) και στη συνέχεια να διαβάζω την τεκμηρίωση στο διαδίκτυο για κάθε βιβλιοθήκη. Κατά τη διαδικασία, έμαθα επίσης πώς να χρησιμοποιώ τις εντολές pip install στη γραμμή εντολών.

Μετά από αυτό, το επόμενο βήμα ήταν να καταλάβω τι ακριβώς ήθελα να κάνω και να μάθω στην επεξεργασία εικόνας και αρχικά, σχεδίαζα να κάνω αντιστοίχιση προτύπων, αλλά ενώ έκανα έρευνα για αυτό, έμαθα για το PCA και το βρήκα πιο ενδιαφέρον, έτσι αποφάσισα να πηγαίνετε με PCA αντ 'αυτού. Ο πρώτος όρος που συνέχιζε να εμφανίζεται ήταν ο αλγόριθμος K-NN (K- πλησιέστερος γείτονας). Αυτή ήταν η πρώτη μου έκθεση σε αλγόριθμο μηχανικής μάθησης. Έμαθα για τα δεδομένα εκπαίδευσης και δοκιμών και τι σημαίνει η «εκπαίδευση» ενός αλγορίθμου. Η κατανόηση του αλγορίθμου K-NN ήταν επίσης προκλητική, αλλά ήταν πολύ ικανοποιητικό να κατανοήσουμε τελικά πώς λειτουργεί. Αυτή τη στιγμή εργάζομαι για να λειτουργήσει ο κωδικός για το K-NN και είμαι πολύ κοντά στην ολοκλήρωσή του.

Βήμα 3: Δυσκολίες που αντιμετωπίζονται και διδάγματα

Η πρώτη μεγάλη δυσκολία ήταν το εύρος του ίδιου του έργου. Αυτό ήταν περισσότερο ερευνητικό παρά φυσικό. Καθώς οι εβδομάδες περνούσαν μερικές φορές κοίταζα την πρόοδο που είχαν οι συνομήλικοί μου και ένιωθα ότι δεν έκανα αρκετά ή ότι δεν είχα αρκετά γρήγορα πρόοδο και αυτό μερικές φορές ήταν πολύ αποθαρρυντικό. Το να μιλήσω με τον καθηγητή Μάλοχ και να καθησυχάσω τον εαυτό μου ότι όντως έμαθα πράγματα που ήταν πολύ καινούργια για μένα με βοήθησε να συνεχίσω. Ένα άλλο πρόβλημα ήταν ότι η γνώση θεωρητικών στοιχείων και η εφαρμογή τους είναι δύο διαφορετικά πράγματα. Αν και ήξερα τι έπρεπε, στην πραγματικότητα η κωδικοποίησή του σε python ήταν μια διαφορετική ιστορία. Αυτό είναι όπου η απλή ανάγνωση εγγράφων στο διαδίκτυο και η ερώτηση φίλων που το γνώριζαν περισσότερο βοήθησε πολύ στο να καταλήξουμε τελικά σε ένα σχέδιο δράσης.

Προσωπικά πιστεύω ότι η κατοχή μιας μεγαλύτερης βιβλιοθήκης βιβλίων και εγγράφων στο M5 θα μπορούσε να βοηθήσει τους ανθρώπους που εργάζονται σε έργα. Επίσης, η ψηφιακή καταγραφή σε πραγματικό χρόνο των έργων που γίνονται από τους μαθητές, έτσι ώστε οι άλλοι μαθητές και το προσωπικό να μπορούν να το δουν και να εμπλακούν εάν τους ενδιαφέρει είναι μια καλή ιδέα για το M5.

Καθώς το έργο τελειώνει, έχω μάθει τόσα πολλά σε τόσο σύντομο χρονικό διάστημα. Έχω αποκτήσει μια πολύ καλή γνώση της μηχανικής μάθησης και αισθάνομαι ότι έχω κάνει τα πρώτα βήματα για να εμπλακώ περισσότερο σε αυτήν. Έχω συνειδητοποιήσει ότι μου αρέσει η όραση στον υπολογιστή και ότι μπορεί να θέλω να το συνεχίσω ακόμη και στο μέλλον. Το πιο σημαντικό έχω μάθει τι είναι το PCA, γιατί είναι τόσο σημαντικό και πώς να το αξιοποιήσω.

Βήμα 4: Επόμενα βήματα

Για μένα, αυτό ήταν απλά το ξύσιμο της επιφάνειας ενός πολύ μεγαλύτερου και κάτι πολύ σημαντικού στον σημερινό κόσμο, δηλαδή της μηχανικής μάθησης. Σχεδιάζω να παρακολουθήσω μαθήματα που σχετίζονται με τη μηχανική μάθηση στο εγγύς μέλλον. Σκοπεύω επίσης να χτίσω το δρόμο μου για την αναγνώριση προσώπου, καθώς εκεί ξεκίνησε όλο αυτό το έργο. Έχω επίσης ιδέες για ένα σύστημα ασφάλειας που χρησιμοποιεί συνδυασμούς χαρακτηριστικών (ένα από αυτά είναι το πρόσωπο του ατόμου) για να το κάνει πραγματικά ασφαλές και αυτό είναι κάτι στο οποίο θέλω να εργαστώ στο μέλλον όταν έχω μια ευρύτερη κατανόηση των πραγμάτων Το

Για οποιονδήποτε σαν εμένα που ενδιαφέρεται για μηχανική εκμάθηση και επεξεργασία εικόνας αλλά δεν έχει προηγούμενη εμπειρία, θα πρότεινα ανεπιφύλακτα την πρώτη εκμάθηση και κατανόηση της γραμμικής άλγεβρας μαζί με στατιστικά στοιχεία (ειδικά διανομές). Δεύτερον, θα πρότεινα να διαβάσετε την αναγνώριση προτύπων και την εκμάθηση μηχανών από τον Christopher M. Bishop. Αυτό το βιβλίο με βοήθησε να καταλάβω τα βασικά για αυτό που έμπαινα και είναι δομημένο πολύ καλά.

Συνιστάται: