Какую статистику использовать при тестировании мультиколлинеарности в python?
Я много читал о мультиколлинеарности, но все еще не уверен, использовать ли шкалу Дурбина-Ватсона, собственные значения или коэффициент инфляции дисперсии. У меня есть только три независимые переменные и собственные значения:
1.81768828 0.95241948 0.22989225
Насколько я понял, только значения, слишком близкие к нулю, указывают на мультиколлинеарность. Я не был уверен, что последний (0,22) считается "близким к нулю", но при проверке его собственного вектора результат:
-0.53977799 -0.44013805 0.71757802
и каждый из них будет указывать коллинеарность, поскольку они НЕ близки к нулю (на этот раз все наоборот). Я прав, пока здесь?
Оценка Дурбина-Уотсона 1.93
(рассчитывается с помощью функции summary() из statsmodels с добавленным перехватом). Это НЕ показывает сильную мультиколлинеарность, верно?
Поскольку никто не дает четких значений "отсечки", меня немного смущает, какие значения считаются "близкими к нулю" или нет.
Должен ли я рассчитать VIF, просто чтобы быть уверенным?
Любая помощь высоко ценится!