Как перебирать и подсчитывать каждое категориальное значение на основе некоторого условия

Я работал над набором данных и хочу перебрать каждое значение, чтобы найти количество рабочих мест и семейное положение на основе депозита.

Пример: ht tps://stackru.com/images/1dacce1138471c6098d83c691c6660d5c93d1117.png

ht tps://stackru.com/images/5f69166ce32b4e38b1c28e23f27c8a1fde529290.png

2 ответа

Думаю, я могу использовать это, что даст мне результат, который не совсем такой же, но дает достаточно понимания для целей анализа с большей ясностью.

bank_data[bank_data['deposit'] == 'no'].groupby(['marital', 'job']).count().iloc[:,-1:]
bank_data[bank_data['deposit'] == 'yes'].groupby(['marital', 'job']).count().iloc[:,-1:]

Я бы порекомендовал группировку панд по работе. Допустим, ваши данные хранятся во фрейме данныхdf:

df.groupby(by = ['job','marital', 'deposit']).count()

Это вернет возможные комбинации "работа", "семейное положение" и "депозит", а также количество элементов, которые вы найдете в этих группах.

Я надеюсь, что это помогает!

Привет,

Т

Другие вопросы по тегам