Какую статистику использовать при тестировании мультиколлинеарности в python?

Я много читал о мультиколлинеарности, но все еще не уверен, использовать ли шкалу Дурбина-Ватсона, собственные значения или коэффициент инфляции дисперсии. У меня есть только три независимые переменные и собственные значения:

1.81768828 0.95241948 0.22989225

Насколько я понял, только значения, слишком близкие к нулю, указывают на мультиколлинеарность. Я не был уверен, что последний (0,22) считается "близким к нулю", но при проверке его собственного вектора результат:

-0.53977799 -0.44013805 0.71757802

и каждый из них будет указывать коллинеарность, поскольку они НЕ близки к нулю (на этот раз все наоборот). Я прав, пока здесь?

Оценка Дурбина-Уотсона 1.93 (рассчитывается с помощью функции summary() из statsmodels с добавленным перехватом). Это НЕ показывает сильную мультиколлинеарность, верно?

Поскольку никто не дает четких значений "отсечки", меня немного смущает, какие значения считаются "близкими к нулю" или нет.

Должен ли я рассчитать VIF, просто чтобы быть уверенным?

Любая помощь высоко ценится!

0 ответов

Другие вопросы по тегам