Как сформировать рекомендацию с матричной факторизацией

Я читал некоторые статьи о матричной факторизации (модель скрытого фактора) в Системе рекомендаций и могу реализовать алгоритм. Я могу получить такой же результат RMSE, как в статье, указанной в наборе данных MovieLens.

Однако я обнаружил, что, если я попытаюсь создать список фильмов, рекомендованных в топ-K(например, K=10) для каждого пользователя по рангу прогнозируемой оценки, то, похоже, фильмы, которые считаются самой высокой оценкой всех пользователей, тот же самый.

Это то, что работает, или я что-то не так?

1 ответ

Это известная проблема в рекомендации.

Иногда его называют эффектом "Гарри Поттера" - (почти) всем нравится Гарри Поттер. Таким образом, большинство автоматизированных процедур выяснит, какие элементы обычно популярны, и порекомендует их пользователям.

Вы можете отфильтровывать очень популярные предметы или умножать прогнозируемый рейтинг на коэффициент, который тем ниже, чем популярнее товар в мире.

Другие вопросы по тегам