Расшифруйте речь в фонемы в Sphinx4
Могу ли я использовать CMUSphinx4 для декодирования определенной речи в фонемы и получения этих фонем в дальнейших реализациях?
2 ответа
Если вы используете sphinx4 (бета-версия 6), в рамках фреймворка есть метод getBestPronasionResult ()
"Этот метод используется, когда приложение хочет, чтобы фонемы находились на наилучшем конечном пути. Обратите внимание, что слова могут иметь более одного произношения, поэтому это не эквивалентно пути слова, например, от одного [HH,W,AH,N] до [T".,UW] три [TH,R,IY]
Возвращает: строка слов и связанных фонем на лучшем пути "
Расположение: src / sphinx4 / edu / cmu / sphinx / result / Result.java
Token.java - это класс, который выполняет реальную работу.
Надеюсь это поможет.
Нашел этот пример кода, который получит объект результата распознавания и сбросит фонемы: http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps
Я нашел этот документ очень полезным для понимания Sphinx4: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf
Поняв архитектуру, я просмотрел список пакетов, найденных на странице javadoc.
Надеюсь, это поможет. Удачи!