Каково значение MIC-R2 в функционировании шахты в Minerva Package R
Пакет Minerva в R предоставляет значение максимального информационного коэффициента (MIC) двух векторов, двух матриц. Функция mine(), которая возвращает значение MIC, также возвращает значение некоторых других параметров. Одним из них является MIC-R2. Из справки, которую я узнал, MIC-R2 означает разницу между MIC и коэффициентом Пирсона.
В пакете минерва,
[MIC,MEV, MCN,MIC-R2]=mine(X,Y,..)
Какова статистическая значимость MIC-R2, а не MIC для выявления корреляций?
1 ответ
MIC и R^2 - оба метода для обнаружения корреляций. MIC-R^2 не для обнаружения корреляции, это мера нелинейности рассматриваемых отношений. Чем оно выше, тем более нелинейными являются отношения.
Коэффициент корреляции Пирсона, назовем его R, можно рассматривать как меру того, насколько хорошо данные соответствуют линии линейной регрессии (линия наилучшего соответствия). Тем не менее, R может быть отрицательным, поэтому людям нравится использовать R^2, потому что он в основном делает то же самое, и это между 0 и 1.
MIC также находится между 0 и 1, но в отличие от R^2, он дает высокие значения нелинейным отношениям. Следовательно, эти два будут очень похожи (MIC-R^2 близко к 0), когда есть линейная зависимость, и очень разные (MIC-R^2 близко к 1), когда есть нелинейная связь.