Сгруппированная корреляция Пирсона
У меня большой датафрейм (форма 100 000*192). Я рассчитал коэффициент Пирсона для каждого атрибута уже. Сейчас я ищу способ расчета корреляций Пирсона для каждой группы. Я имею в виду, что сейчас у меня есть
if A then B
и я хочу рассчитать
if (A AND B) then C
if (A AND B AND C) then (D AND E)
Например
DataFrame 1
A B C
0|0 0 1
1|1 0 0
2|0 1 0
3|1 1 1
Здесь столбцы A и C, по-видимому, не имеют сильной корреляции, A и B или B и C также нет, но когда вы берете A и B, тогда у вас есть корреляция с C (если A = B, то C =1, в противном случае C = 0). Я надеюсь, что это помогает понять.
Есть ли какая-либо функция или библиотека, которые уже делают это, или мне придется много кода итерировать с df.corr()
функция pandas
на моем фрейме данных?