Быстрое расстояние Левенштейна в R?

Существует ли пакет, содержащий функцию подсчета расстояний Левенштейна, которая реализована в виде кода на языке Си или Фортрана? У меня есть много строк для сравнения и stringMatch от MiscPsycho слишком медленный для этого.

3 ответа

Решение

levenshteinDist (из RecordLinkage пакет) вызывает скомпилированный C-код. Попробуйте.

А также stringdist в stringdist пакет делает это тоже, даже быстрее, чем levenshteinDist при определенных условиях ( 1)

Вы могли бы попробовать stringDist от Biostrings также

Вы также можете использовать levenshtein_distance() от textTinyRпакет. У меня были ошибки памяти calloc со всеми другими пакетами, когда дело доходило до больших векторов символов, составляющих около 30 тысяч символов. ТолькоtextTinyR у меня сработало!

Другие вопросы по тегам