Уменьшение / удаление отсечения в SoX при преобразовании частоты дискретизации

Я использую SoX для обрезки набора wav-файлов в 16-кГц, 16-битные одноканальные wav-файлы (которые будут подмножествами одного из начальных wav-файлов). Большинство исходных wav-файлов уже настроены на эту спецификацию, однако я только что обнаружил, что некоторые из них имеют разную частоту дискретизации. Поскольку это будет автоматизировано в Java с использованием ProcessBuilder, я подумал, что мог бы использовать следующую команду:

sox <source_wav> -b 16 <dest_wav> channels 1 rate 16000 trim <startTime> =<endTime>

и это только изменит частоту дискретизации, если это не 16000 Гц. Он делает то, что должен для файлов с одинаковой спецификацией, но для файлов с разной частотой дискретизации, я получаю:

sox WARN rate: rate clipped 48 samples; decrease volume?
sox WARN dither: dither clipped 44 samples; decrease volume?

Как мне справиться с этим, не ухудшая качество звука? Обратите внимание, что я ничего не знаю об обработке сигналов.

2 ответа

Решение

Как подсказывает инструмент, попробуйте немного уменьшить громкость, например, добавив -v 0,99 (или 0,98 и т. Д.). Такие небольшие изменения в объеме незаметны.

Пример:

sox -v 0.99 <source_wav> -b 16 <dest_wav> channels 1 rate 16000 trim <startTime> =<endTime>

Если вы все еще получаете обрезку, то звук, вероятно, сильно обрезается (то есть искажается) для начала (это характерно для современной музыки; см. Википедия: Война громкости), и поэтому предупреждения можно игнорировать - никаких дополнительных искажений не вводится.

Как упомянуто в комментариях, можно указать параметр -G, который автоматически выполнит любую настройку громкости, необходимую для избежания отсечения (за счет небольшого дополнительного времени ЦП, т.е. он работает немного медленнее с -G).

У меня была проблема. Изменение кодировки wav-файла исправило это:

sox input.wav -e signed-integer output.wav
Другие вопросы по тегам