Столбец с идентификатором Transacction ID для правил ассоциации на фреймах данных из Pandas Python.

Я импортировал CSV в Python с помощью Pandas и хотел бы иметь возможность использовать один из них в качестве столбцов в качестве идентификатора транзакции для того, чтобы я мог создавать правила ассоциации.

(ссылка: https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)

Я надеюсь, что кто-то может помочь мне:

Используйте UUID в качестве идентификатора транзакции для меня, чтобы иметь фрейм данных, подобный следующему:

UUID     Desc
123ex    Meat,Beer

Для того, чтобы я получил правила ассоциации, такие как: {Мясо} => {Пиво}.

Кроме того, была бы признательна рекомендация библиотеки сделать это простым способом.

Спасибо за ваше время.

1 ответ

Решение

Вы можете объединить значения в список, выполнив следующие действия:

df.groupby('UUID')['Desc'].apply(list)

Это даст вам то, что вы хотите, если вы хотите вернуть UUID в качестве столбца, который вы можете вызвать reset_index на вышеупомянутом:

df.groupby('UUID')['Desc'].apply(list).reset_index()

Также для серии вы все равно можете экспортировать это в csv так же, как с df:

df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)

Вам может потребоваться назвать свой индекс перед экспортом или, если вам проще, просто reset_index восстановить индекс обратно в виде столбца, а затем вызвать to_csv

Другие вопросы по тегам