Акустическая модель количество часов

Я хочу создать модель для распознавания арабских букв. Я знаю, как создать модель языка и файлы словаря, но я застрял в акустической модели. Я записываю wav-файлы для каждой буквы, но во время обучения говорится, что часы обучения слишком малы, хотя обучение продолжается. Когда я пытаюсь его использовать, модель ничего не распознает (дает ноль).

Я хочу знать, как я должен записывать файлы WAV, должен ли я повторять, например, букву Алиф, например, 100 раз в одном файле WAV, или я должен просто записать несколько файлов WAV одной буквы.

Ваша помощь высоко ценится.

1 ответ

Решение

Я хочу знать, как я должен записывать файлы WAV, должен ли я повторять, например, букву Алиф, например, 100 раз в одном файле WAV, или я должен просто записать несколько файлов WAV одной буквы.

Лучше иметь несколько файлов с непрерывными словами, а не с буквами. Письма трудно распознать.

Когда я пытаюсь его использовать, модель ничего не распознает (дает ноль).

Здесь могут быть разные проблемы (неправильный формат аудио и т. Д.). Вы можете поделиться своей базой данных на форумах CMUSphinx с Dropbox, чтобы получить помощь по этому вопросу.

Другие вопросы по тегам