Как сравнить сигналы двух саундтреков с помощью.net?

Я пытаюсь написать программу, которая может проверить произношение пользователя.

Эта программа будет воспроизводить звуковой сигнал, произносить английское предложение, и пользователь попытается произнести это и записать свой голос, а программа проверит сходство этих сигналов и укажет произношение пользователя.

Вопрос в том, можно ли написать эту программу, используя.net? И если да, то какие библиотеки я могу использовать? Любое руководство для начала?

2 ответа

Программы распознавания музыки обычно представляют звук в спектральной области (как для захвата высоты тона).

Из некоторого спектрального представления можно использовать меру расстояния (евклидово или другое).

Для речи необходимо измерение времени.

В пространственной области меры деформирования, которые учитывают временные деформации (медленная или быстрая), также кажутся хорошим выбором.

Алгоритмы сопоставления с шаблоном могут быть хорошими кандидатами, как и в алгоритмах OCR, но теперь вы будете иметь дело со звуковой волной.

Обычное рассмотрение алгоритмов звуковой волны - скользящие окна или сегментация.

Месут!

Предполагая, что вы используете C#.NET, у меня может быть ответ для вас. Простой поиск в Google привел меня к этому видео на YouTube, которое показывает вам, как "подготовить звуковые сигналы": http://www.youtube.com/watch?v=ZnFoVuOVrUQ

Удачи, а остальное зависит от вас!

Другие вопросы по тегам