Звуковое сходство компьютерного и человеческого голоса

Я ищу алгоритм для сравнения двух звуковых файлов по их фонетике. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютер и записанный человеческий голос, говорящий "Привет", в Audacity (я знаю, это не так профессионально...) и посмотрел на волны.

https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png (К сожалению, мне не разрешено вставлять изображения)

Хотя оба звучат одинаково, волны на самом деле не соответствуют друг другу.

Есть ли способ обнаружить сходство между этими двумя волнами и рассчитать упомянутую оценку?

1 ответ

Решение

Вот проект с открытым исходным кодом, который может вас заинтересовать в бесплатных инструментах и ​​приложениях для распознавания речи. Вот еще один инструмент с открытым исходным кодом для распознавания речи. Я уверен, что если вы "duckduckgo", вы найдете других, если они не на ваш вкус. CHEERS!

Другие вопросы по тегам