Сгруппированная корреляция Пирсона

У меня большой датафрейм (форма 100 000*192). Я рассчитал коэффициент Пирсона для каждого атрибута уже. Сейчас я ищу способ расчета корреляций Пирсона для каждой группы. Я имею в виду, что сейчас у меня есть

if A then B 

и я хочу рассчитать

if (A AND B) then C 
if (A AND B AND C) then (D AND E)

Например

   DataFrame 1 
   A  B  C
 0|0  0  1 
 1|1  0  0 
 2|0  1  0 
 3|1  1  1

Здесь столбцы A и C, по-видимому, не имеют сильной корреляции, A и B или B и C также нет, но когда вы берете A и B, тогда у вас есть корреляция с C (если A = B, то C =1, в противном случае C = 0). Я надеюсь, что это помогает понять.

Есть ли какая-либо функция или библиотека, которые уже делают это, или мне придется много кода итерировать с df.corr() функция pandas на моем фрейме данных?

0 ответов

Другие вопросы по тегам