Как осуществляется холодный запуск в Spark ALS на производстве?
Извлечено из документации по совместной фильтрации в Spark с использованием ALS:
По умолчанию Spark назначает
NaN
предсказания во время ALSModel.transform, когда пользователь и / или фактор элемента не присутствуют в модели. Это может быть полезно в производственной системе, так как оно указывает на нового пользователя или элемент, и поэтому система может принять решение о некотором запасном варианте для использования в качестве прогноза.
Пока я играю с этим coldStartStrategy
параметр в моей песочнице, сals = ALS(userCol="user_id", itemCol="doc_id", ratingCol="rating", coldStartStrategy="drop")
установленный во время обучения и когда пользователь отсутствует в данных обучения, я ничего не получаю, когда пытаюсь рекомендовать продукты этому новому пользователю. Но с als = ALS(userCol="user_id", itemCol="doc_id", ratingCol="rating", coldStartStrategy="nan")
Установленная во время тренировки, модель дает ему некоторые рекомендации. Мой вопрос: как продукты рекомендуются для последнего случая?