Πίνακας περιεχομένων:
- Βήμα 1: Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
- Βήμα 2: Ρύθμιση του BitVoicer
- Βήμα 3: Χρήση του Bitvoicer
- Βήμα 4: Ο κώδικας Arduino
Βίντεο: Κατηγοριοποίηση αναγνώρισης φωνής: 4 βήματα (με εικόνες)
2024 Συγγραφέας: John Day | [email protected]. Τελευταία τροποποίηση: 2024-01-30 08:38
Για το μάθημα TfCD του IPD Master στο TU Delft.
Αυτό είναι ένα διδακτικό πώς να φτιάξετε ένα σύστημα αναγνώρισης φωνής. Εξηγούμε τα βασικά και πώς να ρυθμίσετε αυτό το έργο με τη βοήθεια του Arduino και του BitVoicer. Μετά την ολοκλήρωση των βασικών, πιστεύουμε ότι μπορείτε να χρησιμοποιήσετε αυτό το σύστημα σύμφωνα με τις προτιμήσεις σας.
Βήμα 1: Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Χρειάζεστε το Arduino σας, μερικά καλώδια και LED (τρία θα κάνουν). Συνδέσαμε τις λυχνίες LED στις ακίδες 3, 5 και 6 (όλες οι ακίδες PWM, αν και δεν τις χρησιμοποιούμε). Θυμηθείτε, για αυτό το σεμινάριο εστιάζουμε στη μέθοδο εισαγωγής: αναγνώριση φωνής. Επομένως, δεν εστιάσαμε στην έξοδο αυτού του συστήματος και το κρατήσαμε αρκετά απλό.
Για να αποδείξουμε τη χρήση αυτής της τεχνολογίας, φτιάξαμε ένα κουτί στο οποίο τοποθετήσαμε ρουλεμάν τρισδιάστατης εκτύπωσης για εμφυτεύματα γόνατος. Η ιδέα είναι ότι έχετε πολλά διαφορετικά αντικείμενα και πρέπει να βρείτε το σωστό. Επιλέγουμε να το δείξουμε με ένα μικρό, μεσαίο και μεγάλο αντικείμενο που συμβολίζει ένα ρουλεμάν για ένα εμφύτευμα γόνατος. Για να γίνουν πιο ξεκάθαρα τα πράγματα, αποφασίσαμε να χρησιμοποιήσουμε ένα πράσινο LED για το μικρό μέγεθος, κίτρινο LED για το μεσαίο μέγεθος και κόκκινο για μεγάλο.
Βήμα 2: Ρύθμιση του BitVoicer
Το πρώτο πράγμα που θέλετε να κάνετε είναι να ενεργοποιήσετε το προϊόν σας με τη βοήθεια> ενεργοποίηση. Αυτό σας επιτρέπει να στέλνετε δεδομένα από το Bitvoicer στον μικροελεγκτή σας (Arduino).
Στη συνέχεια, θέλετε να ρυθμίσετε το Bitvoicer ώστε να χρησιμοποιήσει πραγματικά το Arduino για να διαμορφώσει την έξοδο του. Μεταβείτε στο αρχείο> προτιμήσεις. Εδώ βλέπετε μερικές επιλογές:
Μην σε πειράζει η πρώτη παράγραφος. Αυτές είναι προφανείς επιλογές, που σας επιτρέπουν να ανοίξετε και να ξεκινήσετε το σύστημα αναγνώρισης φωνής μόλις ξεκινήσει ο υπολογιστής σας. Μπορεί αργότερα να το σκεφτείτε χρησιμοποιώντας ένα Raspberry Pi και να δημιουργήσετε ένα αυτόνομο σύστημα.
Στη συνέχεια, βλέπετε την ακόλουθη επιλογή:
Γλώσσα αναγνώρισης ομιλίας: προσδιορισμός της γλώσσας που πρέπει να αναγνωρίσει το BitVoicer, Αποδεκτό επίπεδο εμπιστοσύνης: Να γνωρίζετε ότι η αναγνώριση φωνής «προβλέπει» όσα έχουν ειπωθεί. Μπορεί να μην φτάσει ποτέ στο 100%, αλλά το 40% μπορεί να είναι ήδη αρκετό για να λειτουργήσει αποτελεσματικά. Αυτό εξαρτάται από την προφορά του χρήστη, την ένταση του λόγου ή το μικρόφωνο. Θα επανέλθουμε σε αυτό αργότερα.
Ελάχιστο επίπεδο ήχου: Το ελάχιστο επίπεδο ήχου που πρέπει να ακούσει ο υπολογιστής
Περίοδος ενεργοποίησης επιπέδου ήχου (ms): η διάρκεια που πρέπει να ακούγεται μετά την επίτευξη του ελάχιστου επιπέδου ήχου
Περίοδος καθυστέρησης: Καθυστέρηση μεταξύ της φωνητικής εντολής και της εξόδου.
Στην επόμενη παράγραφο, πρέπει να καταργήσετε την επιλογή απενεργοποίησης της επικοινωνίας. Αυτό επιτρέπει στο Bitvoicer να επικοινωνεί με το Arduino. Οι ακόλουθες ρυθμίσεις είναι Όνομα θύρας, Μπιτ ανά δευτερόλεπτο, ισοτιμία, bit διακοπής, έλεγχος ροής. Ορίστε το Όνομα θύρας στη δεξιά σειριακή θύρα (αυτό ονομάζεται COMX με το Χ είναι ένας αριθμός, μπορείτε να το βρείτε κάτω από τη βοήθεια> θύρα στο Arduino). Βεβαιωθείτε ότι τα Bits ανά δευτερόλεπτο είναι 9600. Μπορείτε να αφήσετε τις άλλες επιλογές ως προεπιλεγμένες.
Για την επόμενη παράγραφο, θα χρησιμοποιήσουμε το μικρόφωνο του υπολογιστή.
Τώρα είστε έτοιμοι να παίξετε με το Bitvoicer.
Βήμα 3: Χρήση του Bitvoicer
Σε αυτό το βίντεο εξηγούμε πώς να χρησιμοποιήσετε το Bitvoicer.
Βήμα 4: Ο κώδικας Arduino
Χρησιμοποιήσαμε έναν άλλο πηγαίο κώδικα και τον απλοποιήσαμε για να τον χρησιμοποιήσουμε. Η απλοποιημένη έκδοση με οδηγίες μπορεί να βρεθεί στον συνημμένο κώδικα Arduino. (Μπορείτε να δείτε την πηγή εδώ
Αυτό είναι! Τώρα μπορείτε να χρησιμοποιήσετε φωνητικές εντολές ως είσοδο και να αποφασίσετε ποια έξοδο θέλετε στον κώδικα arduino.
www.youtube.com/watch?v=u8QUKTFdQgU
Συνιστάται:
Καθρέπτης αναγνώρισης προσώπου με μυστικό διαμέρισμα: 15 βήματα (με εικόνες)
Καθρέφτης αναγνώρισης προσώπου με μυστικό διαμέρισμα: Πάντα με ενθουσίαζαν τα πάντα δημιουργικά μυστικά διαμερίσματα που χρησιμοποιούνται σε ιστορίες, ταινίες και άλλα παρόμοια. Έτσι, όταν είδα τον Διαγωνισμό Secret Compartment, αποφάσισα να πειραματιστώ με την ιδέα και να φτιάξω έναν συνηθισμένο καθρέφτη που ανοίγει ένα
Πώς να συνδέσετε την εφαρμογή Android με AWS IOT και κατανόηση API αναγνώρισης φωνής: 3 βήματα
Πώς να συνδέσετε την εφαρμογή Android με AWS IOT και να κατανοήσετε το API αναγνώρισης φωνής: Αυτό το σεμινάριο διδάσκει στον χρήστη πώς να συνδέει την εφαρμογή Android με διακομιστή AWS IOT και να κατανοεί το API αναγνώρισης φωνής που ελέγχει μια μηχανή καφέ. Η εφαρμογή ελέγχει τη μηχανή καφέ μέσω της Alexa Φωνητική υπηρεσία, κάθε εφαρμογή
Σύστημα ασφαλείας αναγνώρισης προσώπου για ψυγείο με Raspberry Pi: 7 βήματα (με εικόνες)
Σύστημα ασφάλειας αναγνώρισης προσώπου για ψυγείο με Raspberry Pi: Περιήγηση στο διαδίκτυο ανακάλυψα ότι οι τιμές των συστημάτων ασφαλείας κυμαίνονται από 150 $ έως 600 $ και άνω, αλλά δεν μπορούν όλες οι λύσεις (ακόμη και οι πολύ ακριβές) να ενσωματωθούν με άλλες έξυπνα εργαλεία στο σπίτι σας! Για παράδειγμα, δεν μπορείτε να ορίσετε
Ρομπότ καθοδήγησης με δυνατότητα αναγνώρισης φωνής: 7 βήματα (με εικόνες)
Ρομπότ καθοδήγησης με δυνατότητα αναγνώρισης φωνής: Το ρομπότ καθοδήγησης είναι ένα κινητό ρομπότ που φτιάξαμε για να καθοδηγεί τους επισκέπτες σε διάφορα τμήματα στην πανεπιστημιούπολη του κολλεγίου μας. Το κάναμε για να μιλήσουμε μερικές προκαθορισμένες δηλώσεις και να προχωρήσουμε μπροστά και πίσω σύμφωνα με τη φωνή εισόδου. Στο κολέγιο μας έχουμε
VRBOT (Ρομπότ αναγνώρισης φωνής): 10 βήματα (με εικόνες)
VRBOT (Ρομπότ αναγνώρισης φωνής): Σε αυτό το Instructable θα φτιάξουμε ένα ρομπότ (περισσότερο σαν αυτοκίνητο RC) το οποίο ελέγχεται με φωνή, δηλαδή Αναγνώριση φωνής. Πριν αρχίσω να σας δίνω περισσότερες λεπτομέρειες, πρέπει να γνωρίζετε ότι πρόκειται για Αναγνώριση φωνής και όχι Αναγνώριση ομιλίας που σημαίνει ότι