Как сделать Языковое Моделирование, используя HTK
Я в замешательстве о том, как использовать HTK для языкового моделирования. Я последовал примеру учебника с сайта Voxforge
http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial
После обучения и тестирования я получил около 78% точности. Я сделал это для моего родного языка. Теперь я должен использовать HTK для языкового моделирования.
Есть ли учебник для того же? Пожалуйста, помогите мне.
Спасибо speech_tri
1 ответ
Если я правильно понимаю ваш вопрос, вы пытаетесь перейти от "грамматики" к подходу "модели языка n-граммы". Эти два метода являются альтернативными способами указания, какие комбинации слов допустимы в ответах, которые вернет распознаватель. Следуя процессу Voxforge, у вас, вероятно, будет грамматика.
Языковая модель исходит из анализа совокупности текста, которая определяет вероятности появления слов вместе. Используемый текстовый корпус может быть очень специализированным. Существует ряд инструментов анализа, таких как SRILM ( http://www.speech.sri.com/projects/srilm/) и MITLM ( https://github.com/mitlm/mitlm), которые будут читать корпус и производить модель.
Поскольку вы используете слова из вашего родного языка, вам понадобится уникальный текстовый корпус для анализа. Один из способов получить тестовый корпус - искусственно сгенерировать несколько предложений из существующей грамматики и использовать их в качестве корпуса. Затем, установив новую языковую модель, вы просто указываете на нее распознаватель вместо грамматики и надеетесь на лучшее.