Есть ли в нидерландском алгоритме сопоставления строк "Sounds-Like"?
Я знаю об алгоритмах Soundex и Double-Methaphone для "звукового" струнного сопоставления на английском языке. Где я могу найти похожий алгоритм или порт одного из алгоритмов для голландского языка?
1 ответ
Решение
Если вы только после алгоритма, я бы проверить NLTK. Если вы предоставите данные, вы сможете протестировать некоторые из них с помощью FST (конечных преобразователей состояния), предоставленных Эдвардом Лопером и Стивеном Бердом. Или, возможно, использовать данные из "Alpino Dutch Treebank", который распространяется вместе с nltk.