Аналогичный алгоритм сопоставления строк: Жаккарда, Кости, Косинус и Точный
Я пытаюсь выяснить сходство между двумя английскими предложениями. Среди алгоритмов сравнения строк Jaccard, Dice, Exact и Cosine, который является лучшим, когда речь идет о сопоставлении строк или определении близости?
Предложение 1: Интернет-магазины электроники, компьютерных комплектующих, аксессуаров для яблок, товаров для красоты и здоровья, видеоигр, аксессуаров для мобильных телефонов, дома и сада и многого другого на tmart.com. Мы предоставляем широкий выбор товаров по лучшей цене для бесплатной доставки по всему миру.
Предложение 2: Покупайте электронику, одежду и многое другое, используя наше приложение Flipkart. Бесплатная доставка и наложенный платеж.