Аудио: уменьшение глубины в программном обеспечении

Как уменьшить битовую глубину аудиофайла? Это игнорирует MSB или LSB? Смесь обоих? (Дополнительный вопрос: как это называется?)

2 ответа

TL / DR: правое смещение переменной высоты звуковой кривой на меньшую битовую глубину

аудио может рассматриваться как аналоговая кривая амплитуды (ось Y) во времени (ось X). Чтобы оцифровать эту кривую (процесс записи), необходимо как-то сохранить кривую в виде байтов памяти (CD/DVD/ жесткий диск), которая может воссоздать кривую при воспроизведении. Обычно кривая дискретизируется (измеряется) X раз в секунду (44,1 кГц). Это определяет частоту дискретизации (чем выше, тем лучше). Для каждой выборки звуковой кривой единственным записанным атрибутом является высота кривой (ось Y). Разрешение (точность) этого значения выборки - ваша битовая глубина. Допустим, после нормализации кривой аналогового звука эта ось Y может изменяться только от 0 до 1

 1 bit of storage can only record two (2^1) values : either 0 or 1
 2 bits can store four (2^2) possible values: 0, 0.33, 0.66, 1.0
 3 bits (2^3) can store 8 possible values: 0 to 1 with increments of 1/8th
 8 bits (2^8) maps to 256 values:          0 to 1 increments of 1/256
16 bits maps to 65536 possible values:     0 to 1 with increments of 1/65536

поэтому, если вы хотите преобразовать битовую глубину из более высокой в ​​более низкую, вы увидите, что это снизит точность вашей кривой, поскольку уменьшит количество возможных значений. Из этого следует, что это уменьшение глубины в битах можно рассматривать как сдвиг битов вправо (отбрасывание со стороны LSB) (правое смещение, распространяющее знак)

Чтобы максимизировать эффективность (требуемое качество звука на хранилище), чтобы уменьшить битовую глубину, мы также сократили бы частоту дискретизации.

Уменьшение битовой глубины полезно для синтеза звука в электронной музыке.

Вы можете кодировать музыкальный файл в 1 бит, но вы не воспроизводите его абсолютно, вы воспроизводите его громче и тише, как производную, и он на самом деле сжимает так же хорошо, как mp3! (~10%)

И на самом деле звучит очень красиво.

Другие вопросы по тегам