Объем обнаружения SoX всегда близок к максимальному
Я пытаюсь определить громкость речи выше порогового значения, короткую, 2-3 секунды, аудиофайлы с sox, но она всегда выходит с максимальной громкостью около 90%, независимо от тишины и шума.
Это команда, которую я использую (я пытался изменить параметр масштаба):
sox noise.wav -n stats -s 99
Если я кричу и держу микрофон во рту или бью его, я могу получить ощутимую разницу примерно в 95% громкости, но это микрофон в стиле настольного компьютера. При воспроизведении аудиофайлов записывается слышимая тишина, но при разговоре на расстоянии все еще существует большое различие.
Есть настройки, которые я пропускаю, или кто-то еще сталкивался с этим?