Быстрое расстояние Левенштейна в R?
Существует ли пакет, содержащий функцию подсчета расстояний Левенштейна, которая реализована в виде кода на языке Си или Фортрана? У меня есть много строк для сравнения и stringMatch
от MiscPsycho
слишком медленный для этого.
3 ответа
Решение
levenshteinDist (из RecordLinkage
пакет) вызывает скомпилированный C-код. Попробуйте.
А также stringdist
в stringdist
пакет делает это тоже, даже быстрее, чем levenshteinDist
при определенных условиях ( 1)
Вы также можете использовать levenshtein_distance()
от textTinyR
пакет. У меня были ошибки памяти calloc со всеми другими пакетами, когда дело доходило до больших векторов символов, составляющих около 30 тысяч символов. ТолькоtextTinyR
у меня сработало!