Столбец с идентификатором Transacction ID для правил ассоциации на фреймах данных из Pandas Python.
Я импортировал CSV в Python с помощью Pandas и хотел бы иметь возможность использовать один из них в качестве столбцов в качестве идентификатора транзакции для того, чтобы я мог создавать правила ассоциации.
(ссылка: https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)
Я надеюсь, что кто-то может помочь мне:
Используйте UUID в качестве идентификатора транзакции для меня, чтобы иметь фрейм данных, подобный следующему:
UUID Desc
123ex Meat,Beer
Для того, чтобы я получил правила ассоциации, такие как: {Мясо} => {Пиво}.
Кроме того, была бы признательна рекомендация библиотеки сделать это простым способом.
Спасибо за ваше время.
1 ответ
Вы можете объединить значения в список, выполнив следующие действия:
df.groupby('UUID')['Desc'].apply(list)
Это даст вам то, что вы хотите, если вы хотите вернуть UUID в качестве столбца, который вы можете вызвать reset_index
на вышеупомянутом:
df.groupby('UUID')['Desc'].apply(list).reset_index()
Также для серии вы все равно можете экспортировать это в csv так же, как с df:
df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)
Вам может потребоваться назвать свой индекс перед экспортом или, если вам проще, просто reset_index
восстановить индекс обратно в виде столбца, а затем вызвать to_csv