Вопрос о создании языковой модели для сингальского УСРИЛ

Question

Вопрос о создании языковой модели для сингальского УСРИЛ

Я пытаюсь создать систему распознавания голоса сингала, используя Pocketsphinx. Я использую инструмент SRILM для создания языковой модели. Мои исходные файлы для создания модели языка здесь. Я использую Cygwin на Windows 8.1 для запуска SRILM 1.7.1. Но как только я запускаю команду

ngram-count -vocab sinhalalexicon.txt -text sinhalacorpus.Train -order 3     -write sinhala.count -unk

я собираюсь

iconv: Invalid or incomplete multibyte or wide character
iconv: Invalid or incomplete multibyte or wide character

Что я тут не так сделал? Файл sinhalacorpus.Train был создан вручную с помощью Notepad++

1

voice-recognition pocketsphinx srilm

Источник

user5055186 23 июл '15 в 09:01

1 ответ

Другие вопросы по тегам voice-recognition pocketsphinx srilm

user5055186 23 июл '15 в 09:58 2015-07-23 09:58 · Answer 1 · 2015-07-23 09:58

Я нашел решение своей проблемы. как только я преобразовал файлы корпусов и лексиконов в формат Unix и изменил кодировку на UTF-8 без спецификации, это сработало. Я использовал Notepad++, чтобы сделать изменения.

1

Источник

user5055186 23 июл '15 в 09:58