Как создать таблицу на случай непредвиденных обстоятельств с использованием панд?
Допустим, у меня есть такие данные:
+-------+--------+--------------+--------+--------------+
| index | used_x | clicked_in_x | used_y | clicked_in_y |
+-------+--------+--------------+--------+--------------+
| 1 | True | False | True | True |
| 2 | False | False | True | False |
| 3 | True | True | False | False |
+-------+--------+--------------+--------+--------------+
И я хотел бы создать таблицу на случай непредвиденных обстоятельств, используя панд, которая показывает такую таблицу:
+--------+----------------+----------------+
| | clicked_from_x | clicked_from_y |
+--------+----------------+----------------+
| used_x | 40 | 3 |
| used_y | 2 | 10 |
+--------+----------------+----------------+
Каков был бы лучший способ достичь этого? До сих пор я попробовал следующее, используя crosstab
метод:
import numpy as np
import pandas as pd
size = 20
df = pd.DataFrame({
'used_x': np.random.choice(a=[False, True], size=size),
'clicked_from_x': np.random.choice(a=[False, True], size=size),
'used_y': np.random.choice(a=[False, True], size=size),
'clicked_from_y': np.random.choice(a=[False, True], size=size),
})
pd.crosstab([df['used_x'], df['used_y']], [df['clicked_from_x'], df['clicked_from_y']], margins=False)
Который дает:
Но это довольно сложно понять, а не представление, на которое я надеялся. Кто-нибудь знает, как получить желаемый результат или, возможно, эквивалентную стратегию с использованием панд?
1 ответ
Решение
Мы будем использовать всемогущего dot
подпрограмма продукта здесь.
i = df.filter(like='clicked')
j = df.filter(like='used')
j.astype(int).T.dot(i)
clicked_from_x clicked_from_y
used_x 6 5
used_y 6 6