Объем обнаружения SoX всегда близок к максимальному

Я пытаюсь определить громкость речи выше порогового значения, короткую, 2-3 секунды, аудиофайлы с sox, но она всегда выходит с максимальной громкостью около 90%, независимо от тишины и шума.

Это команда, которую я использую (я пытался изменить параметр масштаба):

sox noise.wav -n stats -s 99

Если я кричу и держу микрофон во рту или бью его, я могу получить ощутимую разницу примерно в 95% громкости, но это микрофон в стиле настольного компьютера. При воспроизведении аудиофайлов записывается слышимая тишина, но при разговоре на расстоянии все еще существует большое различие.

Есть настройки, которые я пропускаю, или кто-то еще сталкивался с этим?

0 ответов

Другие вопросы по тегам