Акустическая модель количество часов
Я хочу создать модель для распознавания арабских букв. Я знаю, как создать модель языка и файлы словаря, но я застрял в акустической модели. Я записываю wav-файлы для каждой буквы, но во время обучения говорится, что часы обучения слишком малы, хотя обучение продолжается. Когда я пытаюсь его использовать, модель ничего не распознает (дает ноль).
Я хочу знать, как я должен записывать файлы WAV, должен ли я повторять, например, букву Алиф, например, 100 раз в одном файле WAV, или я должен просто записать несколько файлов WAV одной буквы.
Ваша помощь высоко ценится.
1 ответ
Я хочу знать, как я должен записывать файлы WAV, должен ли я повторять, например, букву Алиф, например, 100 раз в одном файле WAV, или я должен просто записать несколько файлов WAV одной буквы.
Лучше иметь несколько файлов с непрерывными словами, а не с буквами. Письма трудно распознать.
Когда я пытаюсь его использовать, модель ничего не распознает (дает ноль).
Здесь могут быть разные проблемы (неправильный формат аудио и т. Д.). Вы можете поделиться своей базой данных на форумах CMUSphinx с Dropbox, чтобы получить помощь по этому вопросу.