Проблема корреляции Пирсона

Я не уверен, какие цифры использовать ниже в задаче, которую я пытаюсь решить, которая включает использование формулы корреляции Пирсона.

    A  B  C  D  E  F
Bob 4  5     4  2
Fra 2  2     2  3  2
Lee 2  4  3        5
Cha 5  4     4  1

"Опишите подход, основанный на окрестности, с использованием корреляции Пирсона и взвешенных средних, чтобы сгенерировать прогноз того, понравится ли Бобу"F". В вашем ответе должны быть изложены основные этапы подхода, основанного на соседстве, и показаны шаги, необходимые для создания прогноза".

Поэтому я хочу выяснить, понравится ли Бобу F... (5= Мне нравится 1= Не нравится) Я понимаю формулу Пирсона, но я не уверен, с каким другим "пользователем" сравнить Боба, или я должен учитывать мнения всех пользователей.

Я также понимаю, как не рекомендуется отвечать на вопросы, похожие на домашнюю работу, но я потратил часы на поиски в Интернете, пытаясь это выяснить.

Любая помощь будет оценена, спасибо заранее.

1 ответ

Вероятно, необходимо увидеть специфику вопроса, чтобы придумать лучший ответ для самого вопроса, но один из подходов, который может показаться жизнеспособным, состоит в том, чтобы вычислить корреляцию между Бобом и каждым другим человеком (Фра, Ли и Ча), и взвесьте их оценки для F этими корреляциями.

В этом случае, поскольку у вас есть только баллы F за Фра и Ли, просто возьмите (corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2

Другие вопросы по тегам