Как интерпретировать предположения линейной регрессии данных

У меня есть набор данных с 3719 наблюдениями с 9 функциями. При этом я выполнил множественную линейную регрессию с выбранными функциями. Получились вот такие диагностические графики:

этот

С помощью графиков я понял, что нет никакой линейности между зависимыми и независимыми переменными. Остаточные графики дают нелинейный тренд. Но из нормального графика QQ оно следует нормальному распределению. Я не понял, что подразумевается под графиками остаточного кредитного плеча?

Я правильно понимаю? Как интерпретировать эти сюжеты.

1 ответ

Решение

Ваши остатки демонстрируют гетероскедастичность (вверху слева), а это означает, что вариативность вашего результата увеличивается вместе со значениями результата. Например, доход против расходов: более богатые люди имеют больше вариантов в цене на продукты, которые они покупают (иногда они покупают дешевую еду, а иногда и дорогую), в то время как более бедные люди, как правило, покупают только дешевую еду.

График QQ (внизу слева) оценивает нормальность допущения об остатках, и я не вижу ничего, что указывало бы на серьезное нарушение. Небольшое отклонение в правом верхнем углу не так серьезно, как проблема гетероскедастичности.

График остатков и кредитного плеча (внизу справа) указывает на точки, которые могут иметь большое влияние на ваши результаты на основе расстояния Кука. Это может помочь выявить выбросы в ваших данных, и вы можете рассмотреть возможность их исключения перед запуском другой модели (довольно субъективная оценка).

Другие вопросы по тегам