Нахождение основной частоты. WAV файла в Java

У меня есть проект для завершения, который требует от меня найти основные частоты фонемных гласных человеческого голоса. Я новичок в обработке звука и не знаю, как это сделать. Кто-нибудь может подсказать мне, как я должен подойти к этой проблеме?

Я пытался найти методы поиска основной частоты с использованием методов БПФ и автокорреляции, но я не могу найти решение. Кто-нибудь может предоставить мне фрагмент кода?

1 ответ

ИМХО RAPT - лучший алгоритм слежения за высотой тона.

Смотрите описание алгоритма.

Я использовал две реализации RAPT:

  • Система подачи речи. С Google вы также можете найти источники. Это очень хорошая эталонная реализация в чистом C. К сожалению, интегрировать это в некоторую систему не очень тривиально.
  • Реализация VOICEBOX MATLAB. Иногда дает другие результаты по сравнению с предыдущей реализацией алгоритма.

Примечание: если вам нужна точная оценка частоты основного тона, вы должны взглянуть на алгоритм Instant-RAPT.

Другие вопросы по тегам