Raspberry Pi Асинхронное / непрерывное распознавание речи в Python

Я хочу создать скрипт распознавания речи для Raspberry Pi в Python и мне нужна библиотека асинхронного / непрерывного распознавания речи. Асинхронный означает, что мне нужно бесконечно выполнять распознавание до тех пор, пока произнесенное слово не будет соответствовать массиву слов без какого-либо ввода с клавиатуры, а затем отобразить произнесенное на терминал и перезапустить распознавание. Я уже взглянул на PocketSphinx, но после нескольких часов поиска в Google, я ничего не нашел об асинхронном распознавании с этим.

Вы знаете какую-нибудь библиотеку, которая на это способна?

2 ответа

Решение

Вы можете использовать Pocketsphinx на Raspberry Pi. Вам необходимо скачать последнюю версию 5prealpha.

Он может прослушивать несколько ключевых фраз. Код должен быть примерно таким:

import sys, os
from pocketsphinx import *
import pyaudio

modeldir = "../../../model"

# Create a decoder with certain model
config = Decoder.default_config()
config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))
config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))
config.set_string('-kws', 'keyphrase.list')

p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=1024)
stream.start_stream()

# Process audio chunk by chunk. On keyword detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
    buf = stream.read(1024)
    decoder.process_raw(buf, False, False)
    if decoder.hyp() != None:
        print "Detected keyword", decoder.hyp(), "restarting search"
        decoder.end_utt()
        decoder.start_utt()

keypharse.list файл должен выглядеть так, одна фраза на строку с порогом

open the door /1e-40/
close the door /1e-40/
how are you /1e-30/

Пороговые значения должны быть настроены для каждой ключевой фразы, чтобы балансировать между ложными тревогами и ошибочными определениями.

Ну, вы можете изменить имя Джаспера, возможно, на что-то другое. Возможно, даже пустая строка.

Другие вопросы по тегам