Рид Соломон или другой кодер и декодер FEC в PHP

Я унаследовал проект PHP, который действительно мог бы извлечь выгоду из формы прямого исправления ошибок, так как он включает (потенциально) пользователей, печатающих в кодированной строке base64 бесконечно переменной длины. Эта строка разбита на группы по 6 символов в настоящее время для простоты транскрипции и объединена вместе перед обработкой, но благодаря введению людей в уравнение ошибки могут возникать и по-прежнему возникают.

Короткие строки, или те, что скопированы и вставлены, обычно хороши. Выбросы длинных, напечатанных вручную, - вот где реальная выгода будет видна.

Я остановился на том, что Рид Соломон является наиболее вероятным кандидатом для достижения этой цели (но я рад, что те, кто имеет более практический опыт, указывают на более подходящую FEC).

Кто-нибудь знает кодировщик и декодер RS с открытым исходным кодом, которые я могу использовать в этом приложении PHP? Я нашел несколько EN-кодеров, которые я, вероятно, смогу взломать из библиотек QRCode, но декодер кажется мифическим. У меня, конечно, есть возможность взять несколько реализаций C и переписать их (я программист, а не специалист по математике, поэтому написание одной с нуля, вероятно, мне не под силу).

Данные в настоящее время выглядят следующим образом (только представление, вероятно, недопустимое base64!):

fD48Sa 483CDf 18ACDx UYh5jS PQXNT

Я бы хотел применить кодировку RS к каждому блоку после его разделения (удлиняя каждый блок, я принимаю это, и это будет приемлемо с точки зрения проекта), ИЛИ применять его до того, как строка будет разбита на блоки по 6 Из того, что я понимаю о RS, однако, это было бы более сложным вариантом, поскольку строка тогда не имеет фиксированной длины.

То, что я надеялся найти после наступления "эврики" с идеей FEC, было то, что позволило бы мне сделать это:

// messy encode pseudocode for demonstration purposes
$data    = "Once upon a time in a land far far away";
$encoded = base64_encode($data);
$split   = chunk_split($encoded, 6, ' ');

foreach($split as $chunk) {
    $rsEncoded .= rsEncode($chunk) . " ";
}

и затем аналогичный rsDecode(), когда он вводится.

Любые намеки приветствуются...

1 ответ

Возможно, я неправильно понимаю вашу проблему, но это не похоже на хороший вариант использования для исправления ошибок вперед.

Прямое исправление ошибок полезно, когда известно, что сообщение корректно в тот момент, когда происходит кодирование. Ошибки, внесенные после этой точки, могут быть преодолены в процессе декодирования. Однако из описываемого вами рабочего процесса звучит так, будто вы хотите закодировать сообщение после того, как пользователь его ввел, что слишком поздно, чтобы обнаружить какие-либо ошибки в их транскрипции.

Возможно, что вы на самом деле описываете получение блока кода Рида-Соломона, когда пользователь вводит свои данные, и используете проверочные символы из полученного блока кода для анализа своих данных. Если количество символов, которые различаются между введенными данными и полученным кодовым блоком, меньше, чем синглтон-граница вашего кода RS, это действительно позволит вам "исправить" ввод пользователя в сообщение, которое вы получили в первую очередь. Я не уверен, почему это было бы полезно, хотя.


Тем не менее, я считаю, что самый простой способ запустить RS в PHP - это вызвать реализацию Python из кода PHP.

В Викиверситете есть очень хорошо документированный кодер / декодер Python и еще одна обобщенная версия той же реализации. Я обнаружил, что оба этих ресурса чрезвычайно полезны при написании моих собственных реализаций C++.

Другие вопросы по тегам