Πίνακας περιεχομένων:
- Βήμα 1: Απαιτούμενα υλικά και αρχεία
- Βήμα 2: Βήμα 2: Ελέγξτε το αρχείο Voicehat.py για περισσότερες πληροφορίες
- Βήμα 3: Βήμα 3: Προσθήκη κώδικα ήχου ενεργοποίησης σε κωδικό επίδειξης
- Βήμα 4: Βήμα 4: Εκτελέστε τον κώδικα και βεβαιωθείτε ότι όλα είναι καλά
- Βήμα 5: Βήμα 5: Δημιουργήστε το δικό σας αρχείο.wav
- Βήμα 6: Βήμα 6: Προσθήκη του ήχου επιβεβαίωσης;
Βίντεο: Προσθήκη Trigger Start Sound στο Google AIY Voice Kit: 6 βήματα (με εικόνες)
2025 Συγγραφέας: John Day | [email protected]. Τελευταία τροποποίηση: 2025-01-13 06:57
Αυτό το σεμινάριο είναι αρκετά απλό. Πραγματικά απολαμβάνω το Google AIY Voice Kit, αλλά μου αρέσει πολύ στο κανονικό μου Google Home ο θόρυβος που κάνουν για να επιβεβαιώσουν ότι ακούνε ενεργά. Αυτό δεν έχει ρυθμιστεί από προεπιλογή σε κανένα από τα παραδείγματα που είναι προφορτωμένα στην εικόνα του AIY Voice Kit.
Περιλαμβάνω επίσης έναν σύνδεσμο για τους θορύβους Έναρξη και Επιβεβαίωση αποθέματος που έχω καταγράψει από το πραγματικό μου Google Home με τη συσκευή εγγραφής Ζουμ.
Ορίστε-το πρώτο μου διδάξιμο!
Βήμα 1: Απαιτούμενα υλικά και αρχεία
- Πλήρως λειτουργικό Google AIY Voice Kit-για να ρυθμίσετε το κιτ σας επισκεφθείτε την επίσημη σελίδα του AIY Voice Kit.
- Δυνατότητα πρόσβασης στο τερματικό Pi σας μέσω SSH, VNC ή με οθόνη και πληκτρολόγιο
- . Wav αρχείο που θέλετε να αναπαράγεται όταν το Pi ακούει φωνητική είσοδο-Εάν δεν χρησιμοποιείτε προσαρμοσμένο αρχείο, κατεβάστε το τυπικό αρχείο "St art Talking" εδώ ή κατεβάστε το από τον συνημμένο σύνδεσμο.
- (Προαιρετικό) Πρόγραμμα επεξεργασίας ήχου που μπορεί να μετατρέψει αρχεία και να αλλάξει το ρυθμό μετάδοσης bit και δείγματος
Βήμα 2: Βήμα 2: Ελέγξτε το αρχείο Voicehat.py για περισσότερες πληροφορίες
ΣΠΟΥΔΑΙΟΣ
Δεν χρησιμοποιώ την πιο πρόσφατη εικόνα στο κιτ φωνής μου που περιλαμβάνει τον κωδικό τόσο για το κιτ φωνής όσο και για το όραμα (δηλαδή aiyprojects-2018-01-03.img). Χρησιμοποιώ τον κώδικα από τον κλάδο του Voice Kit που μπορείτε να βρείτε στο Google AIY Raspbian GitHub. Η προσωπική μου γνώμη είναι να χρησιμοποιήσετε απλώς τον κλάδο του Voice Kit για να το κρατήσετε απλό και να μην χρειάζεται να ασχολείστε με τον κωδικό Vision όταν εργάζεστε με το κιτ φωνής σας
Προχωράω…
Αυτό το βήμα δεν είναι εντελώς υποχρεωτικό, αλλά θα σας δείξει πού έχει κρύψει η Google τις οδηγίες για να λειτουργήσει αν θέλετε να το κάνετε ένα βήμα παραπέρα ή να καταλάβετε γιατί λειτουργεί ο κώδικας που προσθέτω.
pi@raspberry: cd AIY-voice-kit-python/src/aiy/
Στη συνέχεια, θα ελέγξουμε το αρχείο voicehat.py σε αυτόν τον φάκελο:
pi@raspberry:/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py
Η συνημμένη εικόνα δείχνει πού μπορείτε να μάθετε για τις διεπαφές χρήστη κατάστασης και πώς να χρησιμοποιήσετε έναν ήχο κατά τη σκανδάλη.
Εντάξει, τώρα ας προσθέσουμε κάποιο κώδικα σε ένα από τα παραδείγματα αρχείων για να λειτουργήσει αυτό το πράγμα.
Βήμα 3: Βήμα 3: Προσθήκη κώδικα ήχου ενεργοποίησης σε κωδικό επίδειξης
Πρώτα, μεταβείτε στο φάκελο AIY-voice-kit-python και εκτελέστε τον πηγαίο κώδικα
cd AIY-voice-kit-python
πηγή env/bin/activ
cd src
Στη συνέχεια, χρησιμοποιήστε το 'sudo nano' είτε στο 'assist_grpc_demo.py' είτε στο 'assist_library_demo.py'
Η διαφορά μεταξύ των δύο αρχείων είναι ότι ο βοηθός_grpc_demo.py χρησιμοποιεί το κουμπί για να ενεργοποιήσει τον Βοηθό Google και ο βοηθός_library_demo.py χρησιμοποιεί τη λέξη ενεργοποίησης "Ok, Google" για να ενεργοποιήσει τον Βοηθό Google.
Και για τα δύο αυτά αρχεία χρειάζεται μόνο να προσθέσετε ΜΙΑ γραμμή κώδικα:
status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')
Αυτό προϋποθέτει ότι έχετε τοποθετήσει τον ήχο εκκίνησης στο φάκελο/home/pi/και τον έχετε ονομάσει googlestart.wav. Αλλάξτε αυτά με βάση ό, τι ονομάσατε στο αρχείο σας και οπουδήποτε το εντοπίσατε.
Η γραμμή κώδικα που ψάχνουμε είναι παρακάτω:
status_ui.status ("ακρόαση")
Θέλουμε να προσθέσουμε τη νέα γραμμή κώδικα ΠΡΙΝ από αυτήν τη γραμμή κώδικα…
Για το παράδειγμα 'assist_library_demo.py' μπορείτε να το βρείτε εδώ:
elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:
# Και τώρα προσθέστε τον κωδικό μας status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('ακρόαση')
Για το παράδειγμα 'assist_grpc_demo.py' μπορείτε να το βρείτε εδώ:
button.wait_for_press ()
# Και τώρα προσθέστε τον κωδικό μας status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('ακρόαση')
Αυτό προϋποθέτει ότι έχετε τοποθετήσει τον ήχο εκκίνησης στο φάκελο/home/pi/και τον έχετε ονομάσει googlestart.wav. Αλλάξτε αυτά με βάση ό, τι ονομάσατε στο αρχείο σας και οπουδήποτε το εντοπίσατε.
Πατήστε CTRL-X & Y για να αποθηκεύσετε τα πάντα.
*** ΣΗΜΕΙΩΣΗ: Βρήκα κάτι λίγο χαζό. Για το 'assist_library_demo.py' η προσθήκη του ήχου σκανδάλης δεν φαίνεται να κάνει καμία διαφορά στη λειτουργία της αναγνώρισης ομιλίας. Για το 'assist_grpc_demo.py' όμως, φαίνεται ότι όταν εφαρμόζετε τον ήχο σκανδάλης, διακόπτει την πρώτη ή δύο λέξεις που λέτε. Δεν είμαι απόλυτα σίγουρος γιατί. Ακόμα προσπαθώ να το καταλάβω.
Βήμα 4: Βήμα 4: Εκτελέστε τον κώδικα και βεβαιωθείτε ότι όλα είναι καλά
pi@raspberry: cd AIY-voice-kit-python
και φορτώστε το virtualenv
pi@raspberry: ~/AIY-voice-kit-python $ source env/bin/activ
και τρέξτε το!
(env) pi@raspberry:/AIY-voice-kit-python $ src/assist_library_demo.py
ή
(env) pi@raspberry:/AIY-voice-kit-python $ src/assist_grpc_demo.py
Τώρα πείτε "Εντάξει, Google" ή Πατήστε αυτό το κουμπί και δείτε αν λειτουργεί!
Η επόμενη σελίδα θα σας βοηθήσει εάν έχετε το δικό σας προσαρμοσμένο αρχείο και τις κατάλληλες τιμές bit και δείγματος για το αρχείο.wav
Βήμα 5: Βήμα 5: Δημιουργήστε το δικό σας αρχείο.wav
Εάν δεν ενδιαφέρεστε να χρησιμοποιήσετε το αρχείο.wav του τυπικού ήχου εκκίνησης του Google Home, θα πρέπει να δημιουργήσετε το δικό σας αρχείο.wav. Χρειάστηκε λίγη δοκιμή και σφάλμα για να λειτουργήσει το σωστό ποσοστό bit και δείγματος για μένα.
Χρησιμοποίησα το Logic Pro X για να κάνω όλη μου την επεξεργασία (στην εικόνα), η οποία είναι ένα πλήρες DAW για τη δημιουργία και παραγωγή μουσικής. Δύο επιλογές που βρήκα ότι θα μπορούσαν να είναι κατάλληλες είναι το Switch ή το MediaHuman Audio Converter. Υποθέτω ότι μπορείτε να το κάνετε αυτό με το Garageband εάν έχετε Mac, αλλά δεν το έχω δοκιμάσει.
Υπάρχουν τρία βασικά μέρη του αρχείου σας που χρειάζονται για να λειτουργήσει με τον κωδικό επίδειξης.
- Πρέπει να είναι ένα αρχείο ήχου MONO
- Το δείγμα πρέπει να είναι 32000
- Πρέπει να είναι αρχείο.wav
- (Προαιρετικό) Η ανάλυση 16 bit λειτουργεί καλύτερα για μένα
Βήμα 6: Βήμα 6: Προσθήκη του ήχου επιβεβαίωσης;
Εδώ έχω κολλήσει αν κάποιος έχει κάποια σκέψη. Θα ήθελα να προσθέσω τον θόρυβο επιβεβαίωσης εάν το σύστημα αναγνωρίσει τη φωνητική είσοδο όπως σε ένα κανονικό Google Home.
Επισυνάπτω τον παρακάτω θόρυβο επιβεβαίωσης για τη διευκόλυνσή σας.
Απολαμβάνω!