Pocketsphinx не может декодировать файл MFC, в то время как Pocketsphinx_continuous декодирует соответствующий WAV
Я работаю с CMUsphinx для перевода турецкого языка в текст в течение пары месяцев. Мне удалось запустить поезд на 100 часов звука. Моей целью было использовать получившуюся акустическую модель с декодером Sphinx3. Однако Sphinx3 декодер не может декодировать мои тестовые файлы WAV. Затем я заметил, что sphinxtrain запускает pocketsphinx_batch в конце обучения для тестирования модели.
Итак, я начал работать над poscketsphinx. Я нахожусь в точке, где пакет pocketsphinx не может декодировать wav-файл (на самом деле он не производит ничего другого), но непрерывный pocketsphinx производит более значимый вывод с тем же файлом (например, 10 правильных слов из 15 слов).
Я предполагаю, что пропускаю некоторые шаги настройки. У меня есть сжатый архив по этой ссылке, который включает в себя акустические и языковые модели, словарь и файлы WAV, которые я пытаюсь декодировать.
Я прошу помощи, чтобы иметь возможность использовать мою модель с Sphinx3 и Pocketsphinx_batch.
Спасибо.
1 ответ
К счастью, я нашел проблему. Это были векторы функций, которые создаются sphinx_fe. Я создавал их со значениями по умолчанию. После прочтения файлов make_feats.pl и sphinxtrain.cfg я создал векторы функций, совместимые с акустической моделью. Sphinxtrain.cfg имеет параметр lifter как 22, но если мы используем sphinx_fe со значениями по умолчанию, lifter равен 0, что означает отсутствие lifter. Я создал MFC с Lifter значение 22, то это сработало.