Какие измерения расстояний хорошо работают в основанных на контенте системах рекомендаций?

Я хочу внедрить систему рекомендаций, основанную на контенте, которая предоставляет список рекомендованных книг на основе пользовательского ввода.

Я буду использовать TF-IDF, чтобы определить, насколько важно слово для данной книги, и создам вектор характеристик книги для каждой книги.

Мне нужно создать матрицу сходства, чтобы определить возможную пару книг. Я наткнулся на Евклидово расстояние для этого. Любые другие методы лучше, чем евклидова?

1 ответ

Вот некоторые хорошие меры расстояния, которые вы можете попробовать:

  • (обобщенно) расстояние по Джакарду
  • Манхэттенское расстояние
  • Расстояние Хеллингера
  • косинусное сходство
Другие вопросы по тегам