Кодирование / декодирование десятичных значений в двоичных блоках с переменной битовой шириной

Я пытаюсь создать двоичный кодировщик / декодер с переменной битовой шириной для протокола в персональном сетевом проекте, который я разрабатываю... и мой тупой мозг полностью запутался в том, как понять двоичное кодирование / декодирование с переменной битовой пропускной способностью. Я смотрю на тот же ~18 SLOC уже около четырех дней, и я все еще чувствую себя совершенно вне себя. Я чувствую, что должен быть в состоянии понять это, но, к сожалению, мой мозг случайным образом отключается, когда я пытаюсь отслеживать различные числовые отношения:(

Теоретически, то, что я хочу сделать, невероятно просто. Я объявляю список битовых полос и значение, которое я хочу сохранить в этой битовой полосе, например:

[10 bits]: 1013
[1  bit ]: 1
[2  bits]: 3
[19 bits]: 51209

Принимая во внимание битовую ширину, значения будут последовательно упорядочены в двоичную строку следующим образом:

               1 bit
               | 2 bits  
               | ||  
  /-10 bits--\ | \/ /------ 19 bits ------\  
  12345678  12 3 45 678  12345678  12345678  
  11111101  01 1 11 000  11001000  00001001  
  \----------/ | \/ \---------------------/
      1012     1  3          51209

Поток битов, выделенный жирным шрифтом выше, - это то, что я передаю по проводам:

11111101  253  FD
01111000  120  78
11001000  200  C8
00001001    9  09

На другом конце я отображаю список {10, 1, 2, 19} (набор битовой ширины, обозначенный вверху) в сравнении с последовательностью байтов, которые я получил, что затем оставляет мне исходный набор значений, которые я хотел передать.

Хотя это, в основном, общий алгоритмический вопрос, и семантика любого конкретного языка, возможно, не имеет значения, я должен упомянуть, что я использую PHP для этого - и одна из причин, по которой я так застрял, состоит в том, что я пытаюсь решить как избежать обращения к строковым манипуляциям, которые PHP, похоже, одержимо склоняет к тому, чтобы побуждать их отдавать предпочтение правильной числовой обработке. Однако эта функция (надеюсь) будет обрабатывать данные на скоростях от 2 до 3 цифр-Мбит / с, и я хочу, чтобы процедуры были максимально быстрыми. (Кстати, я бы использовал другой язык, но PHP - тот, который я знаю больше всего>_>)

Я понимаю основы двоичного кода, и я должен подчеркнуть, что у меня действительно есть работающий кодер, я думаю (он выводит двоичные данные в обратном направлении) - но я понятия не имею, что я здесь делаю. Я не спрашиваю "как мне написать эту функцию", я спрашиваю "какова структурная механика того, что я делаю, и как мне вообще это понять".

Я должен также отметить, что эта проблема не является замаскированным домашним заданием; это для компонента сетевой библиотеки в персональном программном проекте, который я проектирую, который, я надеюсь, научит меня сетям, обработке событий и параллелизму. Надеюсь, я смогу понять все другие вещи, которые мне нужно будет реализовать... LOL

1 ответ

Чтобы дать вам небольшую отправную точку, как такой двоичный декодер / кодировщик может выглядеть вот как пример:

Итак, что же это за концепция?

Довольно просто я перебираю все данные, которые вы хотите отправить, и разделяю их на отдельные байты. Итак, в качестве примера:

data:    1013
bitMask:   10

Поэтому я сначала вычисляю, сколько байтов требуется для его отправки. Здесь это будет 2 байта 8 бит на байт.

После всех подготовительных работ и вычислений легко отправлять все данные побайтно и побитно! Так что, если мы возьмем пример сверху, это будет выглядеть примерно так:

data:    1013  -> 0000'0011 1111'0101
bitMask:   10

total amount of bytes: 2
1. byte = 1111'0101
2. byte = 0000'0011

Таким образом, при отправке данных (здесь вывод в браузере) вы отображаете данные в обратном порядке! Потому что, когда вы получаете его, вы меняете его обратно и получаете правильные результаты!

<?php

    class binaryCoder {

        /* Properties */
        public $data;  // <-- save/receive data into this property
        public $bitMask = [];
        private $byteCount = 0x00;

        /* Constructor */
        public function __construct() {


        }

        /* Methods */
        public function writeData(array $data, array $bitMask) {

            $this->data = $data;
            $this->bitMask = $bitMask;
            $this->byteCount = array_reduce($this->bitMask, function($byteCount, $bits){
                return $byteCount + ceil($bits/8);
            }, 0x00);


            foreach(array_combine($this->bitMask, $this->data) as $mask => $data) {
                for($byteCounter = 0; $byteCounter < ceil($mask/8); $byteCounter++) {
                    $this->writeByte($data >> ($byteCounter*8));
                }
            }

        }

        public function readData(array $bitMask) {
            $this->bitMask = $bitMask;
            $byte = 0x00;


            foreach($this->bitMask as $key => $mask) {
                $message[$key] = "";
                for($byteCounter = 0; $byteCounter < ceil($mask/8); $byteCounter++, $byte++) {
                    $message[$key] = sprintf("%08d", $this->readByte($byte*8)) . $message[$key];
                }
            }

            $message = array_map("bindec", $message);
            print_r($message);

        }

        private function writeByte($byte) {
            for($bitCount = 0; $bitCount < 8; $bitCount++) {
                $this->writeBit((bool)($byte & (1 << $bitCount)));
            }
        }

        private function readByte($bytePosition) {
            $byte = 0x00;

            for($bitCount = 0; $bitCount < 8; $bitCount++) {
                $byte |= (int)$this->readBit($bytePosition+$bitCount) << $bitCount;
            }
            return decbin($byte);
        }

        private function writeBit($bit) {
            echo ($bit?1:0);  // --> send/write data to dest. (Note it's reversed!)
        }

        private function readBit($bit) {
            return $this->data[$bit];
        }


    }


    /* Testing */
    $binaryTransmitter = new binaryCoder();
    $binaryTransmitter->writeData([1013, 1, 3, 51209], [10, 1, 2, 19]);
    $binaryTransmitter->data = "10101111110000001000000011000000100100000001001100000000";  //received data 
    $binaryTransmitter->readData([10, 1, 2, 19]);

?>

выход:

10101111110000001000000011000000100100000001001100000000 //note output here is reversed!
Array ( [0] => 1013 [1] => 1 [2] => 3 [3] => 51209 )
Другие вопросы по тегам