Основная частота женского голоса

Согласно тому, что я прочитал в Интернете, нормальный диапазон основной частоты женского голоса составляет от 165 до 255 Гц. Я использую Praat, а также библиотеку Python Parselmouth, чтобы получить основные значения частоты женского голоса в аудиофайле (.wav). Тем не менее, я получил некоторые значения, которые превышают 255 Гц (например: 400+ Гц, 500 Гц). Нормально ли получать такие большие значения?

1 ответ

Это возможно, но маловероятно, если вы пытаетесь уловить основную частоту (F0) говорящего голоса. Вероятно, вместо этого вы захватываете более легко резонирующий обертон (например, F1 или F2).

Мои эксперименты с Praat создают у меня впечатление, что при хороших параметрах он будет надежно извлекать F0.

Что вы хотите сделать, это проверить, сравнив кривую основного тона со спектрограммой. Вот пример фитинга, сделанного Praat (женский оратор):

Вы можете видеть из изображения, которое

  • Наиболее заметная частота, кажется, F2
  • Около 200 Гц, вероятно, будет F0, так как ниже этого уровня только шум (по сравнению с до / после сегмента)
  • Praat рассчитал хорошую оценку F0 для сегментов вокализованной речи

Если после визуального осмотра кажется, что вы получаете неправильные результаты, вы можете попытаться настроить параметры. Длина окна сильно влияет на разрешение по частоте.

Если вы не можете зафиксировать такие низкие частоты, попробуйте увеличить длину окна - интуиция заключается в том, что он дает алгоритму больше шансов найти медленно меняющиеся периодические особенности в данных.

Другие вопросы по тегам