Κατηγοριοποίηση αναγνώρισης φωνής: 4 βήματα (με εικόνες)
Κατηγοριοποίηση αναγνώρισης φωνής: 4 βήματα (με εικόνες)
Anonim
Image
Image
Κατηγοριοποίηση αναγνώρισης φωνής
Κατηγοριοποίηση αναγνώρισης φωνής
Κατηγοριοποίηση αναγνώρισης φωνής
Κατηγοριοποίηση αναγνώρισης φωνής

Για το μάθημα TfCD του IPD Master στο TU Delft.

Αυτό είναι ένα διδακτικό πώς να φτιάξετε ένα σύστημα αναγνώρισης φωνής. Εξηγούμε τα βασικά και πώς να ρυθμίσετε αυτό το έργο με τη βοήθεια του Arduino και του BitVoicer. Μετά την ολοκλήρωση των βασικών, πιστεύουμε ότι μπορείτε να χρησιμοποιήσετε αυτό το σύστημα σύμφωνα με τις προτιμήσεις σας.

Βήμα 1: Προετοιμασία της εξόδου: Το Arduino και το κουτί σας

Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Προετοιμασία της εξόδου: Το Arduino και το κουτί σας
Προετοιμασία της εξόδου: Το Arduino και το κουτί σας

Χρειάζεστε το Arduino σας, μερικά καλώδια και LED (τρία θα κάνουν). Συνδέσαμε τις λυχνίες LED στις ακίδες 3, 5 και 6 (όλες οι ακίδες PWM, αν και δεν τις χρησιμοποιούμε). Θυμηθείτε, για αυτό το σεμινάριο εστιάζουμε στη μέθοδο εισαγωγής: αναγνώριση φωνής. Επομένως, δεν εστιάσαμε στην έξοδο αυτού του συστήματος και το κρατήσαμε αρκετά απλό.

Για να αποδείξουμε τη χρήση αυτής της τεχνολογίας, φτιάξαμε ένα κουτί στο οποίο τοποθετήσαμε ρουλεμάν τρισδιάστατης εκτύπωσης για εμφυτεύματα γόνατος. Η ιδέα είναι ότι έχετε πολλά διαφορετικά αντικείμενα και πρέπει να βρείτε το σωστό. Επιλέγουμε να το δείξουμε με ένα μικρό, μεσαίο και μεγάλο αντικείμενο που συμβολίζει ένα ρουλεμάν για ένα εμφύτευμα γόνατος. Για να γίνουν πιο ξεκάθαρα τα πράγματα, αποφασίσαμε να χρησιμοποιήσουμε ένα πράσινο LED για το μικρό μέγεθος, κίτρινο LED για το μεσαίο μέγεθος και κόκκινο για μεγάλο.

Βήμα 2: Ρύθμιση του BitVoicer

Ρύθμιση BitVoicer
Ρύθμιση BitVoicer

Το πρώτο πράγμα που θέλετε να κάνετε είναι να ενεργοποιήσετε το προϊόν σας με τη βοήθεια> ενεργοποίηση. Αυτό σας επιτρέπει να στέλνετε δεδομένα από το Bitvoicer στον μικροελεγκτή σας (Arduino).

Στη συνέχεια, θέλετε να ρυθμίσετε το Bitvoicer ώστε να χρησιμοποιήσει πραγματικά το Arduino για να διαμορφώσει την έξοδο του. Μεταβείτε στο αρχείο> προτιμήσεις. Εδώ βλέπετε μερικές επιλογές:

Μην σε πειράζει η πρώτη παράγραφος. Αυτές είναι προφανείς επιλογές, που σας επιτρέπουν να ανοίξετε και να ξεκινήσετε το σύστημα αναγνώρισης φωνής μόλις ξεκινήσει ο υπολογιστής σας. Μπορεί αργότερα να το σκεφτείτε χρησιμοποιώντας ένα Raspberry Pi και να δημιουργήσετε ένα αυτόνομο σύστημα.

Στη συνέχεια, βλέπετε την ακόλουθη επιλογή:

Γλώσσα αναγνώρισης ομιλίας: προσδιορισμός της γλώσσας που πρέπει να αναγνωρίσει το BitVoicer, Αποδεκτό επίπεδο εμπιστοσύνης: Να γνωρίζετε ότι η αναγνώριση φωνής «προβλέπει» όσα έχουν ειπωθεί. Μπορεί να μην φτάσει ποτέ στο 100%, αλλά το 40% μπορεί να είναι ήδη αρκετό για να λειτουργήσει αποτελεσματικά. Αυτό εξαρτάται από την προφορά του χρήστη, την ένταση του λόγου ή το μικρόφωνο. Θα επανέλθουμε σε αυτό αργότερα.

Ελάχιστο επίπεδο ήχου: Το ελάχιστο επίπεδο ήχου που πρέπει να ακούσει ο υπολογιστής

Περίοδος ενεργοποίησης επιπέδου ήχου (ms): η διάρκεια που πρέπει να ακούγεται μετά την επίτευξη του ελάχιστου επιπέδου ήχου

Περίοδος καθυστέρησης: Καθυστέρηση μεταξύ της φωνητικής εντολής και της εξόδου.

Στην επόμενη παράγραφο, πρέπει να καταργήσετε την επιλογή απενεργοποίησης της επικοινωνίας. Αυτό επιτρέπει στο Bitvoicer να επικοινωνεί με το Arduino. Οι ακόλουθες ρυθμίσεις είναι Όνομα θύρας, Μπιτ ανά δευτερόλεπτο, ισοτιμία, bit διακοπής, έλεγχος ροής. Ορίστε το Όνομα θύρας στη δεξιά σειριακή θύρα (αυτό ονομάζεται COMX με το Χ είναι ένας αριθμός, μπορείτε να το βρείτε κάτω από τη βοήθεια> θύρα στο Arduino). Βεβαιωθείτε ότι τα Bits ανά δευτερόλεπτο είναι 9600. Μπορείτε να αφήσετε τις άλλες επιλογές ως προεπιλεγμένες.

Για την επόμενη παράγραφο, θα χρησιμοποιήσουμε το μικρόφωνο του υπολογιστή.

Τώρα είστε έτοιμοι να παίξετε με το Bitvoicer.

Βήμα 3: Χρήση του Bitvoicer

Σε αυτό το βίντεο εξηγούμε πώς να χρησιμοποιήσετε το Bitvoicer.

Βήμα 4: Ο κώδικας Arduino

Χρησιμοποιήσαμε έναν άλλο πηγαίο κώδικα και τον απλοποιήσαμε για να τον χρησιμοποιήσουμε. Η απλοποιημένη έκδοση με οδηγίες μπορεί να βρεθεί στον συνημμένο κώδικα Arduino. (Μπορείτε να δείτε την πηγή εδώ

Αυτό είναι! Τώρα μπορείτε να χρησιμοποιήσετε φωνητικές εντολές ως είσοδο και να αποφασίσετε ποια έξοδο θέλετε στον κώδικα arduino.

www.youtube.com/watch?v=u8QUKTFdQgU