Нахождение основной частоты. WAV файла в Java
У меня есть проект для завершения, который требует от меня найти основные частоты фонемных гласных человеческого голоса. Я новичок в обработке звука и не знаю, как это сделать. Кто-нибудь может подсказать мне, как я должен подойти к этой проблеме?
Я пытался найти методы поиска основной частоты с использованием методов БПФ и автокорреляции, но я не могу найти решение. Кто-нибудь может предоставить мне фрагмент кода?
1 ответ
ИМХО RAPT - лучший алгоритм слежения за высотой тона.
Смотрите описание алгоритма.
Я использовал две реализации RAPT:
- Система подачи речи. С Google вы также можете найти источники. Это очень хорошая эталонная реализация в чистом C. К сожалению, интегрировать это в некоторую систему не очень тривиально.
- Реализация VOICEBOX MATLAB. Иногда дает другие результаты по сравнению с предыдущей реализацией алгоритма.
Примечание: если вам нужна точная оценка частоты основного тона, вы должны взглянуть на алгоритм Instant-RAPT.