Как опубликовать настройки процесса? (Я использую спарк ALS неявно)

Я знаком со статьей "Совместная фильтрация для наборов данных неявной обратной связи" http://yifanhu.net/PUB/cf.pdf. Я использую ALS Spark ml неявно, чтобы рекомендовать элементы пользователям, с параметрами Alpha = 30, Rank = 10, RegParam = 0.1. В моем наборе данных есть только пользователи, которые используют более одного элемента (в соответствии с приведенным здесь советом. Как улучшить результат моей рекомендации? Я использую неявный спарк ALS)

я использую .recommendForAllUsers и получить предпочтения p_ui, Затем я фильтрую только "новые" рекомендации (комбинации пользовательских элементов, которых не было во входном наборе данных). Я также фильтрую предпочтения> 0.01, чтобы получить только самые предпочтительные элементы.

Вопрос в следующем: как я могу постобработать предпочтения, чтобы сделать их более похожими на "вероятности"? (это требование к моей программе выводить какую-то "вероятность").

Это хорошая идея, чтобы масштабировать предпочтения [0.5, 1.0]? (используя формулу:

scaled_preference = ($"preference"*0.5 + max_preference*0.5 -
  min_preference)/(max_preference - min_preference) ) ?

0 ответов

Другие вопросы по тегам