Почему Джасперу нужно так много зависимостей?
Я пробую Джаспера на Распбиане. Согласно документам Jasper, наряду с PocketSphinx, мы также должны установить CMUCLMTK, MIT Language Modeling Toolkit, m2m-aligner, OpenFST и Phonetisaurus.
Как только я закончил установку PocketSphinx, но перед установкой всех этих зависимостей я использовал pocketsphinx_continuous
проверить распознавание голоса. Независимо от точности, он, очевидно, смог уловить мою речь и прошел через процесс интерпретации. Я даже создал свой собственный .lm
а также .dict
файлы с помощью lmtool CMU и попробовал их pocketsphinx_continuous
без проблем.
Мой вопрос заключается в следующем: PocketSphinx, кажется, в состоянии выполнить распознавание речи без всех этих зависимостей. Почему Джаспер говорит мне, чтобы установить их? Нужны ли они PocketSphinx? В каких целях они служат?
2 ответа
В этом списке как минимум 2 не нужны. CMUCLMTK и MITLM - это наборы инструментов языкового моделирования с одинаковыми функциональными возможностями. Даже если вы хотите заменить онлайн lmtool, вам нужен только один из них. То же самое, Фонетизавр требует MITLM и m2m-aligner только для обучения моделей g2p, а не для их использования.
Поэтому в идеале вы хотите, чтобы MITLM, OpenFST и phonetisaurus заменяли онлайн-инструмент lmtool и добавляли новые слова локально. Вам не нужны CMUCLMTK и m2m-aligner.
В будущем Pocketsphinx сможет работать с новыми словами без Phonetisaurus, поэтому вы сможете отбросить эту зависимость.
Вам нужно пожаловаться разработчикам Jasper, если они все еще доступны для жалоб.
CMUCLMTK, MITLM, m2m-aligner, OpenFST и Phonetisaurus не являются зависимостями PocketSphinx и не требуются PocketSphinx.
Джаспер использует CMUCLMTK для компиляции языковой модели (.lm).
Фонетизавр зависит от OpenFST Lib.
Джаспер использует Phonetisaurus для составления словаря (.dict).
Джаспер не использует MITLM и m2m-aligner.
MITLM, m2m-aligner (только один раз) и OpenFST требуются для компиляции модели G2P(FST) из корпуса.