Расшифруйте речь в фонемы в Sphinx4

Могу ли я использовать CMUSphinx4 для декодирования определенной речи в фонемы и получения этих фонем в дальнейших реализациях?

2 ответа

Если вы используете sphinx4 (бета-версия 6), в рамках фреймворка есть метод getBestPronasionResult ()

"Этот метод используется, когда приложение хочет, чтобы фонемы находились на наилучшем конечном пути. Обратите внимание, что слова могут иметь более одного произношения, поэтому это не эквивалентно пути слова, например, от одного [HH,W,AH,N] до [T".,UW] три [TH,R,IY]

Возвращает: строка слов и связанных фонем на лучшем пути "

Расположение: src / sphinx4 / edu / cmu / sphinx / result / Result.java

Token.java - это класс, который выполняет реальную работу.

Надеюсь это поможет.

Нашел этот пример кода, который получит объект результата распознавания и сбросит фонемы: http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

Я нашел этот документ очень полезным для понимания Sphinx4: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf

Поняв архитектуру, я просмотрел список пакетов, найденных на странице javadoc.

Надеюсь, это поможет. Удачи!

Другие вопросы по тегам