Неправильные прогнозы с совместной фильтрацией Graphlab knn
Я использую item_simility_recommender из Graphlab, и я заметил, что функция предиката () присваивает ноль большинству предсказанных элементов, даже если рейтинги идут от 1 до 5. Это, конечно, приводит к очень высокой RMSE.
Поскольку item_simility_recommender основан на KNN, я предполагаю, что прогнозируемые рейтинги должны быть от 1 до 5. Может кто-нибудь объяснить мне, почему это происходит??
Код просто выглядит следующим образом:
train, test = graphlab.recommender.util.random_split_by_user(dataset, max_num_users=1000)
m = graphlab.recommender.item_similarity_recommender.create(train, target='target', only_top_k=65)
rmse=m.evaluate_rmse(test, target='target')
print(m.predict(test))