Какие измерения расстояний хорошо работают в основанных на контенте системах рекомендаций?
Я хочу внедрить систему рекомендаций, основанную на контенте, которая предоставляет список рекомендованных книг на основе пользовательского ввода.
Я буду использовать TF-IDF, чтобы определить, насколько важно слово для данной книги, и создам вектор характеристик книги для каждой книги.
Мне нужно создать матрицу сходства, чтобы определить возможную пару книг. Я наткнулся на Евклидово расстояние для этого. Любые другие методы лучше, чем евклидова?
1 ответ
Вот некоторые хорошие меры расстояния, которые вы можете попробовать:
- (обобщенно) расстояние по Джакарду
- Манхэттенское расстояние
- Расстояние Хеллингера
- косинусное сходство