Как сравнить сигналы двух саундтреков с помощью.net?
Я пытаюсь написать программу, которая может проверить произношение пользователя.
Эта программа будет воспроизводить звуковой сигнал, произносить английское предложение, и пользователь попытается произнести это и записать свой голос, а программа проверит сходство этих сигналов и укажет произношение пользователя.
Вопрос в том, можно ли написать эту программу, используя.net? И если да, то какие библиотеки я могу использовать? Любое руководство для начала?
2 ответа
Программы распознавания музыки обычно представляют звук в спектральной области (как для захвата высоты тона).
Из некоторого спектрального представления можно использовать меру расстояния (евклидово или другое).
Для речи необходимо измерение времени.
В пространственной области меры деформирования, которые учитывают временные деформации (медленная или быстрая), также кажутся хорошим выбором.
Алгоритмы сопоставления с шаблоном могут быть хорошими кандидатами, как и в алгоритмах OCR, но теперь вы будете иметь дело со звуковой волной.
Обычное рассмотрение алгоритмов звуковой волны - скользящие окна или сегментация.
Месут!
Предполагая, что вы используете C#.NET, у меня может быть ответ для вас. Простой поиск в Google привел меня к этому видео на YouTube, которое показывает вам, как "подготовить звуковые сигналы": http://www.youtube.com/watch?v=ZnFoVuOVrUQ
Удачи, а остальное зависит от вас!