Как перебирать и подсчитывать каждое категориальное значение на основе некоторого условия
Я работал над набором данных и хочу перебрать каждое значение, чтобы найти количество рабочих мест и семейное положение на основе депозита.
Пример: ht tps://stackru.com/images/1dacce1138471c6098d83c691c6660d5c93d1117.png
ht tps://stackru.com/images/5f69166ce32b4e38b1c28e23f27c8a1fde529290.png
2 ответа
Думаю, я могу использовать это, что даст мне результат, который не совсем такой же, но дает достаточно понимания для целей анализа с большей ясностью.
bank_data[bank_data['deposit'] == 'no'].groupby(['marital', 'job']).count().iloc[:,-1:]
bank_data[bank_data['deposit'] == 'yes'].groupby(['marital', 'job']).count().iloc[:,-1:]
Я бы порекомендовал группировку панд по работе. Допустим, ваши данные хранятся во фрейме данныхdf
:
df.groupby(by = ['job','marital', 'deposit']).count()
Это вернет возможные комбинации "работа", "семейное положение" и "депозит", а также количество элементов, которые вы найдете в этих группах.
Я надеюсь, что это помогает!
Привет,
Т