Сравните две версии текстового файла и найдите дополнения / удаления с помощью Ruby?
Я отслеживаю изменения на веб-странице, используя Ruby. После того, как я удалил все html-теги и пустые строки, я получил массив строк, который нужно проверить на наличие добавлений / удалений, предполагая, что могут быть повторения. Не могли бы вы порекомендовать хороший драгоценный камень, если он уже был сделан?
Я мог бы сделать строки массива уникальными, и тогда проблему можно избежать. Но что, если мне нужно отследить повторяющиеся строки относительно их положения в тексте?
1 ответ
Решение
Походит на случай учебника, где вы хотели бы использовать алгоритм Diff.
Есть драгоценный камень 'diff', хотя, честно говоря, я никогда не использовал его: http://rubygems.org/gems/diff