Πίνακας περιεχομένων:
- Βήμα 1: Ενότητα Elechouse V3 Αναγνώριση φωνής
- Βήμα 2: Σύνδεση της μονάδας στο Arduino
- Βήμα 3: Ρύθμιση του κώδικα
- Βήμα 4: Αποτέλεσμα
Βίντεο: Εισαγωγή στη φωνητική αναγνώριση με το Elechouse V3 και το Arduino .: 4 βήματα (με εικόνες)
2024 Συγγραφέας: John Day | [email protected]. Τελευταία τροποποίηση: 2024-01-30 08:37
Γεια σου…
Η τεχνολογία αναγνώρισης φωνής ήταν εδώ τα τελευταία χρόνια. Θυμόμαστε ακόμα τον μεγάλο ενθουσιασμό που είχαμε ενώ μιλούσαμε με το πρώτο iphone με δυνατότητα Siri. Από τότε, οι συσκευές φωνητικών εντολών έχουν αυξηθεί σε πολύ προχωρημένο επίπεδο πέρα από τις προσδοκίες μας σε πολύ σύντομο χρονικό διάστημα. Με την εισαγωγή πολλών προηγμένων συστημάτων αναγνώρισης φωνής ήρθαν πολλοί άλλοι βοηθοί φωνής όπως ο βοηθός Google και η Amazon Alexa. Η γρήγορη επιτυχία του Amazon Echo από μόνο του αποδεικνύει ότι σταδιακά συμβιβαζόμαστε με την επικοινωνία με μηχανές.
Ας ξεκινήσουμε λοιπόν από τα βασικά. Σε αυτό το διδακτικό θα σας δώσω μια εισαγωγή σχετικά με τη μονάδα Elechouse V3 Voice Recognition Module και πώς να ενεργοποιήσετε/απενεργοποιήσετε ένα LED χρησιμοποιώντας φωνητικές εντολές. Υπάρχουν πολλοί άλλοι τρόποι για να εφαρμόσετε την αναγνώριση φωνής στο έργο σας, από ένα τηλέφωνο Android έως Alexa ή Raspberry pi ή κάποια άλλη τεχνολογία. Αλλά έλαβα πολλά μηνύματα από πολλούς φίλους μου που με ρωτούσαν πώς να χρησιμοποιήσω αυτήν τη συγκεκριμένη ενότητα με το Arduino. Γράφω λοιπόν αυτό το διδακτικό ως βασικό σεμινάριο για την ενότητα Elechouse V3. Wantedθελα να το κάνω όσο το δυνατόν πιο απλό για αρχάριους, οπότε δεν θα συζητήσουμε τα πλήρη χαρακτηριστικά και λειτουργίες της ενότητας, αλλά στο τέλος, είμαι βέβαιος ότι θα πάρετε μερικές πολύ ωραίες ιδέες για το επόμενο έργο σας Το
Βήμα 1: Ενότητα Elechouse V3 Αναγνώριση φωνής
Το Elechouse V3 είναι ένα από τα πιο συμπαγή και εύκολα ελεγχόμενα στοιχεία αναγνώρισης φωνής στην αγορά.
Υπάρχουν δύο τρόποι για να χρησιμοποιήσετε αυτήν την ενότητα, χρησιμοποιώντας τη σειριακή θύρα ή μέσω των ενσωματωμένων ακίδων GPIO. Ο πίνακας V3 έχει τη δυνατότητα να αποθηκεύσει έως και 80 φωνητικές εντολές η καθεμία με διάρκεια 1500 χιλιοστά του δευτερολέπτου. Αυτό δεν θα μετατρέψει τις εντολές σας σε κείμενο αλλά θα το συγκρίνει με ένα ήδη ηχογραφημένο σύνολο φωνών. Επομένως τεχνικά δεν υπάρχουν γλωσσικά εμπόδια για τη χρήση αυτού του προϊόντος. Μπορείτε να ηχογραφήσετε την εντολή σας σε οποιαδήποτε γλώσσα ή κυριολεκτικά οποιοσδήποτε ήχος μπορεί να εγγραφεί και να χρησιμοποιηθεί ως εντολή. Έτσι πρέπει πρώτα να το εκπαιδεύσετε προτού το αφήσετε να αναγνωρίσει οποιεσδήποτε φωνητικές εντολές.
Εάν χρησιμοποιείτε τη μονάδα με τις καρφίτσες GPIO, η μονάδα θα παρέχει εξόδους μόνο για 7 εντολές από τις 80. Για αυτήν τη μέθοδο πρέπει να επιλέξετε και να φορτώσετε 7 εντολές στο αναγνωριστικό και ο αναγνωριστής θα στείλει εξόδους στα αντίστοιχα Το GPIO καρφώνει εάν κάποια από αυτές τις φωνητικές εντολές αναγνωριστεί. Καθώς το χρησιμοποιούμε με το arduino, δεν χρειάζεται να ασχοληθούμε με τις περιορισμένες δυνατότητες.
Η συσκευή λειτουργεί σε εύρος τάσης εισόδου 4,5 - 5 βολτ και θα αντλεί ρεύμα μικρότερο από 40 mA. Αυτή η ενότητα μπορεί να λειτουργήσει με ακρίβεια αναγνώρισης 99% εάν χρησιμοποιείται υπό ιδανικές συνθήκες. Η επιλογή μικροφώνου και ο θόρυβος στο περιβάλλον παίζει ζωτικό ρόλο στην επίδραση της απόδοσης της μονάδας. Είναι προτιμότερο να επιλέξετε ένα μικρόφωνο με καλή ευαισθησία και να προσπαθήσετε να μειώσετε τον θόρυβο στο παρασκήνιο σας, ενώ δίνετε εντολές για να λάβετε τη μέγιστη απόδοση από τη μονάδα.
Βήμα 2: Σύνδεση της μονάδας στο Arduino
Τώρα ας μιλήσουμε για τις συνδέσεις που πρέπει να γίνουν.
Απαιτείται υλικό:
Ενότητα Elechouse V3 Αναγνώριση φωνής
Arduino UNO R3. (Χρησιμοποιώ το Arduino Pro Mini εδώ, δεν έχει σημασία, και τα δύο είναι σχεδόν ίδια στη λειτουργία.)
Μικρόφωνο με προσαρτημένο βύσμα 3,5 mm. (ή μπορείτε να το κολλήσετε απευθείας στον πίνακα. Έχουν δώσει τις καρφίτσες.)
Ένα LED
Αντίσταση 470 ohm για το LED
Σύρματα όπως απαιτείται
Καλώδιο USB για τον προγραμματισμό του Arduino
Σύνδεση της μονάδας στο Arduino
GND - Έδαφος
VCC - 5 V
RXD - Digitalηφιακή ακίδα 3 του Arduino (Αυτό είναι ένα pin που ορίζεται από το χρήστη. Ο κώδικας δείγματος έχει το Pin 3 ως Tx.)
TXD - pinηφιακή ακίδα 2 του Arduino (Αυτό είναι επίσης ένα pin που ορίζεται από το χρήστη.)
Το LED είναι συνδεδεμένο με τον ψηφιακό ακροδέκτη 13 του Arduino όπως ορίζεται στο δείγμα κώδικα. Συνδέστε μια αντίσταση 470 ohms σε σειρά στο LED.
Συνδέστε το μικρόφωνο στην υποδοχή 3,5 mm στην πλακέτα. Συγκολλήστε το στις ακίδες του μικροφώνου στη μονάδα εάν δεν συνοδεύεται από βύσμα 3,5 mm.
Αυτό είναι όλο για τις συνδέσεις. Τώρα ας ρίξουμε μια ματιά στον κώδικα.
Βήμα 3: Ρύθμιση του κώδικα
Όλοι οι κωδικοί και οι βιβλιοθήκες που αναφέρονται εδώ είναι ανοιχτού κώδικα και οι πιστώσεις για την ανάπτυξη τους πηγαίνουν στους αντίστοιχους συγγραφείς τους.
Θα πρέπει να κατεβάσετε και να εγκαταστήσετε τη βιβλιοθήκη Arduino "voicerecognitionv3.h" προτού μπορέσετε να χρησιμοποιήσετε τη μονάδα με ένα Arduino.
Κατεβάστε τη βιβλιοθήκη από εδώ.
Όλοι οι κωδικοί που χρειαζόμαστε βρίσκονται στο αρχείο zip της βιβλιοθήκης ως παραδείγματα προγραμμάτων.
Εκπαίδευση της Ενότητας V3
Όπως ανέφερα παραπάνω, πρέπει να εκπαιδεύσουμε τη μονάδα προτού μπορέσουμε να την χρησιμοποιήσουμε για αναγνώριση φωνής. Ακολουθήστε αυτά τα βήματα για να εκπαιδεύσετε την ενότητα.
Συνδέστε το κύκλωμα στον υπολογιστή
Εκκινήστε το Arduino IDE
Ελέγξτε αν έχετε επιλέξει τον σωστό πίνακα Arduino. (Εργαλεία -> Πίνακας)
Ελέγξτε αν έχει επιλεγεί η σωστή θύρα COM. (Εργαλεία -> Θύρα)
Τώρα ανοίξτε το δείγμα προγράμματος για την εκπαίδευση της ενότητας
Μεταβείτε στο Αρχείο -> Παραδείγματα -> VoiceRecognitionV3 -> vr_sample_train
Ανεβάστε τον κώδικα στο Arduino και περιμένετε μέχρι να φορτωθεί ο κώδικας. (Ctrl + U)
Ανοίξτε το Serial Monitor. (Ctrl + Shift + M)
Βεβαιωθείτε ότι ο ρυθμός baud έχει οριστεί σε 115200 και είναι επιλεγμένη η επιλογή "Newline"
Εάν όλα είναι εντάξει, θα εμφανιστεί ένα μενού στη σειριακή οθόνη όπως φαίνεται στις εικόνες
Υπάρχουν πολλές εντολές που μπορείτε να πληκτρολογήσετε στη σειριακή οθόνη για να προγραμματίσετε τη μονάδα, εδώ θα χρησιμοποιήσουμε την εντολή "train" για να εκπαιδεύσουμε τη μονάδα
Το V3 έχει δυνατότητα αποθήκευσης 80 φωνητικών εντολών, καθεμίας με διάρκεια 1500 ms. Κάθε εντολή αποθηκεύεται σε μια διεύθυνση από 0 έως 79
Χρησιμοποιώντας την εντολή "τρένο", αποθηκεύουμε μια φωνητική εντολή σε μια συγκεκριμένη διεύθυνση, οπότε θα πρέπει να καθορίσετε τη διεύθυνση στην εντολή
Η σύνταξη της εντολής είναι η εξής: διεύθυνση τρένου Για παράδειγμα: τρένο 0, τρένο 20, τρένο 79
- Θα χρειαστούμε δύο φωνητικές εντολές για τον έλεγχο της λυχνίας LED. Η μία εντολή για ενεργοποίηση και η άλλη για απενεργοποίηση.
- Εισαγάγετε την εντολή στη σειριακή οθόνη ακολουθούμενη από τη διεύθυνση που θέλετε να την αποθηκεύσετε. πχ: τρένο 20.
Αφού εισαγάγετε την εντολή, περιμένετε να εμφανιστεί ένα μήνυμα στη σειριακή οθόνη που λέει "μιλήστε τώρα". Τώρα πείτε την εντολή σας για ενεργοποίηση της λυχνίας LED στο μικρόφωνο αρκετά καθαρά και δυνατά
Εάν η εντολή είναι αρκετά σαφής, θα εμφανιστεί ένα άλλο μήνυμα που θα σας ζητά να μιλήσετε ξανά. Μιλήστε το ξανά για να καταχωρήσετε την εντολή
Ο κωδικός θα σας ζητήσει να επαναλάβετε την εντολή εάν εμφανιστεί θόρυβος κατά την εγγραφή ή εάν ο ήχος δεν είναι αρκετά καθαρός. Η ποιότητα του μικροφώνου σας έχει σημαντικό ρόλο εδώ. Ενδέχεται να μην καταχωρήσετε μια εντολή εάν το μικρόφωνό σας δεν είναι αρκετά καλό. Επίσης εκπαιδεύστε τον πίνακα σε περιβάλλον χωρίς θόρυβο
Μόλις εισαγάγετε με επιτυχία μια φωνή στη μονάδα, επαναλάβετε την ίδια διαδικασία για να εισαγάγετε τη φωνητική εντολή για απενεργοποίηση της λυχνίας LED. Θυμηθείτε να αποθηκεύσετε την εντολή σε διαφορετική διεύθυνση. Για παράδειγμα: τρένο 30
Εάν έχετε φορτώσει επιτυχώς και τις δύο εντολές, είστε πλέον έτοιμοι να ανεβάσετε τον κώδικα για τον έλεγχο της λυχνίας LED
Έλεγχος της λυχνίας LED χρησιμοποιώντας φωνητικές εντολές
Ανοίξτε το δείγμα προγράμματος για τον έλεγχο της λυχνίας LED
Μεταβείτε στο Αρχείο -> Παραδείγματα -> VoiceRecognitionV3 -> vr_sample_control_led
Σε αυτό το πρόγραμμα, δύο εγγραφές ορίζονται ως "onrecord" (για ενεργοποίηση της λυχνίας LED) και "offrecord" (για απενεργοποίηση της λυχνίας LED)
Αλλάξτε την τιμή του "onrecord" στη διεύθυνση της φωνητικής εντολής που έχετε εκπαιδεύσει για να ενεργοποιήσετε το LED
- Αλλάξτε την τιμή του "offrecord" στη διεύθυνση της φωνητικής εντολής που έχετε εκπαιδεύσει για να απενεργοποιήσετε το LED.
- Τώρα ανεβάστε τον κώδικα στο Arduino. (Ctrl+U)
Αυτό είναι όλο. Τώρα είστε έτοιμοι να ελέγξετε το LED σας με φωνητικές εντολές.
Βήμα 4: Αποτέλεσμα
Για να δοκιμάσετε το κύκλωμα, εκφωνήστε τις εντολές ακριβώς όπως το εκπαιδεύσατε να ενεργοποιεί/απενεργοποιεί το LED. Θυμηθείτε, η ποιότητα του μικροφώνου σας και ο θόρυβος γύρω από το περιβάλλον σας θα επηρεάσουν πραγματικά την έξοδο. Δοκιμάστε να το δοκιμάσετε σε περιβάλλον χωρίς θόρυβο ή αλλάξτε το μικρόφωνο εάν δεν λαμβάνετε σωστή απάντηση για τις φωνητικές εντολές σας. Ανοίξτε επίσης τη σειριακή οθόνη για να ελέγξετε εάν η συσκευή ανταποκρίνεται στις φωνητικές εντολές σας. Εάν μια εντολή αναγνωριστεί, η σειριακή οθόνη θα εμφανίσει ένα μήνυμα με τη διεύθυνση της αναγνωρισμένης εντολής.
Συγχαρητήρια! Έχετε μάθει να ελέγχετε ένα LED χρησιμοποιώντας φωνητικές εντολές. Τώρα μπορείτε να μετατρέψετε οποιαδήποτε τέτοια συσκευή σε φωνητικά ελεγχόμενη συσκευή. Συνδέστε μια μονάδα ρελέ στο Arduino για να ελέγχετε συσκευές AC όπως μια λάμπα ή έναν ανεμιστήρα.
Υπάρχουν πολλές δυνατότητες να το εφαρμόσουμε στην καθημερινή μας ζωή. Μοιραστείτε τις σκέψεις σας στην παρακάτω ενότητα σχολίων.
Ελπίζω ότι αυτό το διδακτικό σας έδωσε μια βασική ιδέα σχετικά με τη χρήση της μονάδας Elechouse V3 Voice Recognition με το Arduino. Εάν έχετε οποιεσδήποτε ερωτήσεις, μη διστάσετε να το ρωτήσετε εδώ ή στείλτε ένα μήνυμα ηλεκτρονικού ταχυδρομείου στο [email protected]. Θα προσπαθήσω με τον καλύτερο δυνατό τρόπο να σας βοηθήσω.
Συνιστάται:
Αναγνώριση προσώπου και αναγνώριση - Arduino Face ID χρησιμοποιώντας OpenCV Python και Arduino .: 6 βήματα
Αναγνώριση προσώπου και αναγνώριση | Arduino Face ID χρησιμοποιώντας OpenCV Python και Arduino .: Αναγνώριση προσώπου Το αναγνωριστικό προσώπου AKA είναι ένα από τα πιο σημαντικά χαρακτηριστικά στα κινητά τηλέφωνα στις μέρες μας. Έτσι, είχα μια ερώτηση " μπορώ να έχω ένα αναγνωριστικό προσώπου για το έργο μου στο Arduino " και η απάντηση είναι ναι … Το ταξίδι μου ξεκίνησε ως εξής: Βήμα 1: Πρόσβαση σε εμάς
Εισαγωγή στη σάρωση και την τροποποίηση χαρακτηριστικών: 9 βήματα
Εισαγωγή στη σάρωση και την τροποποίηση χαρακτηριστικών: Αυτό το σεμινάριο θα σας εκθέσει στη βασική εντολή Sweep, χαρακτηριστικά οπών, κυκλικό μοτίβο, φιλέτο, Chamfer, περιστροφή και επαναχρησιμοποίηση σκίτσων. Αποκτήστε πρόσβαση στο πακέτο σχεδίασης για τεχνική διαστασιολόγηση και χρησιμοποιήστε τα ηχητικά βίντεο για να σας βοηθήσουμε να ρίξετε
DIY MusiLED, Μουσικά συγχρονισμένα LED με εφαρμογή με ένα κλικ Windows & Linux (32-bit & 64-bit). Εύκολο στην αναδημιουργία, εύκολο στη χρήση, εύκολο στη θύρα .: 3 βήματα
DIY MusiLED, Μουσικά συγχρονισμένα LED με εφαρμογή με ένα κλικ Windows & Linux (32-bit & 64-bit). Εύκολη αναδημιουργία, εύκολη στη χρήση, εύκολη μεταφορά: Αυτό το έργο θα σας βοηθήσει να συνδέσετε 18 LED (6 κόκκινα + 6 μπλε + 6 κίτρινα) στον πίνακα Arduino και να αναλύσετε τα σήματα σε πραγματικό χρόνο της κάρτας ήχου του υπολογιστή σας και να τα μεταφέρετε σε τα LED για να τα ανάβουν σύμφωνα με τα εφέ beat (Snare, High Hat, Kick)
Εισαγωγή στη συγκόλληση SMD: 8 βήματα (με εικόνες)
Εισαγωγή στη συγκόλληση SMD: Πολλοί άνθρωποι εδώ μπορεί να πιστεύουν ότι το SMD είναι αδύνατο αφού οι καρφίτσες είναι τόσο μικρές και η συγκόλληση θέλει να κολλάει σε κάθε καρφίτσα, αλλά στην πραγματικότητα είναι πολύ εύκολο. Αυτό θα σας διδάξει τα βασικά της συγκόλλησης SMD εάν κατασκευάσετε οτιδήποτε λειτουργεί με συγκόλληση SMD και
Φτηνό (όπως στη Δωρεάν [όπως στη Μπύρα]) Στάση πολλαπλών μέτρων: 4 βήματα
Φτηνό (όπως στη Δωρεάν [όπως στη Μπύρα]) Στάση πολλαπλών μέτρων: Έχω ενοχληθεί που πρέπει να γεράσω το λαιμό μου ή να εξισορροπήσω επισφαλώς το φθηνό μου πολύμετρο 4 $, κάπου όπου μπορώ πραγματικά να ΔΙΑΒΑΣΩ την οθόνη. Αποφάσισα λοιπόν να πάρω την κατάσταση στα χέρια μου! Αυτό είναι επίσης το πρώτο μου «δομήσιμο», οπότε αν κάποιος έχει χρήσιμη επικοινωνία