Уменьшение / удаление отсечения в SoX при преобразовании частоты дискретизации
Я использую SoX для обрезки набора wav-файлов в 16-кГц, 16-битные одноканальные wav-файлы (которые будут подмножествами одного из начальных wav-файлов). Большинство исходных wav-файлов уже настроены на эту спецификацию, однако я только что обнаружил, что некоторые из них имеют разную частоту дискретизации. Поскольку это будет автоматизировано в Java с использованием ProcessBuilder, я подумал, что мог бы использовать следующую команду:
sox <source_wav> -b 16 <dest_wav> channels 1 rate 16000 trim <startTime> =<endTime>
и это только изменит частоту дискретизации, если это не 16000 Гц. Он делает то, что должен для файлов с одинаковой спецификацией, но для файлов с разной частотой дискретизации, я получаю:
sox WARN rate: rate clipped 48 samples; decrease volume?
sox WARN dither: dither clipped 44 samples; decrease volume?
Как мне справиться с этим, не ухудшая качество звука? Обратите внимание, что я ничего не знаю об обработке сигналов.
2 ответа
Как подсказывает инструмент, попробуйте немного уменьшить громкость, например, добавив -v 0,99 (или 0,98 и т. Д.). Такие небольшие изменения в объеме незаметны.
Пример:
sox -v 0.99 <source_wav> -b 16 <dest_wav> channels 1 rate 16000 trim <startTime> =<endTime>
Если вы все еще получаете обрезку, то звук, вероятно, сильно обрезается (то есть искажается) для начала (это характерно для современной музыки; см. Википедия: Война громкости), и поэтому предупреждения можно игнорировать - никаких дополнительных искажений не вводится.
Как упомянуто в комментариях, можно указать параметр -G, который автоматически выполнит любую настройку громкости, необходимую для избежания отсечения (за счет небольшого дополнительного времени ЦП, т.е. он работает немного медленнее с -G).
У меня была проблема. Изменение кодировки wav-файла исправило это:
sox input.wav -e signed-integer output.wav