Как улучшить распознавание речи при запуске с PocketSphinx Android?
Я использую PocketSphinx на Android. После инициализации распознавателя я запускаю прослушиватель ключевых слов. Сначала распознаватель не будет ничего соответствовать. Но через несколько секунд распознаватель начинает сопоставлять ключевые слова с отличной производительностью (около 3% WER при первоначальном тестировании). Время, необходимое для начала сопоставления, зависит от слова / фразы. Это также, кажется, зависит от того, сколько раз вы произносите слово. Например, "плюс" сопоставляется очень быстро, обычно по первому или второму высказыванию, для сравнения требуется в среднем 2 секунды. "Небольшая помощь, пожалуйста", с другой стороны, занимает около 10 секунд, или около 8-10 высказываний. Как только любое ключевое слово найдено, Sphinx переходит в высокопроизводительный режим для всех ключевых слов. Итак, один из обходных путей (хотя и не очень удачный) - сказать "плюс" сразу после завершения инициализации. В то время, когда сопоставление не происходит, Sphinx вызывает onBeginningOfSpeech() и onEndOfSpeech(), что соответствует высказываниям ключевой фразы или ключевого слова.
Файл ключевого слова:
cancel last
a little help please
add new cut/1e-35/
set material
set quantity
plus/5e-2/
minus/5e-2/
Я использую pocketsphinx-android-5prealpha-nolib.jar и (если это имеет значение) проверил на Samsung Galaxy-S3 и Motorola Moto E (2nd Gen). Проблема в том же, использую ли я гарнитуру или нет.
1 ответ
Используйте стандартную модель, которая поставляется с демо PocketSphinx, en-us-ptm
, Это легковесная * модель, и значения CMN по умолчанию установлены в feat.params
файл. Поскольку значения CMN установлены, Sphinx не нужно тратить время на их установку при запуске, а это означает, что нет никаких задержек в получении результатов распознавания качества при запуске. Общие результаты распознавания с моделью по умолчанию по сравнению с другими, на которых я тестировал, очень похожи на мои грамматики командования и управления.
* менее 7 МБ по сравнению с другими, такими как Voxforge, которые более чем в два раза