Рыночная корзина и кластеризация в Python

У меня большие панды DataFrame это выглядит так:

OrderID     OrderedItems    ItemsQuantity
10052009    I0                  2
10052009    I1                  1
10052009    I2                  1
10052009    I3                  1
10448900    I4                  5
10448900    I5                  5
10189322    I2                  1
10189322    I2                  1

Теперь я хочу узнать, какие все предметы заказаны вместе и преобладают связки.

1 ответ

Я предполагаю, что вы знакомы с алгоритмами кластеризации и т. Д. Вы можете использовать эти данные, и с помощью sklearn, пожалуйста, запустите K Means на любом другом алгоритме кластеризации.

http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

PS: Я предполагаю, что это всего лишь образец данных.

Далее аналогичным образом вы можете запустить ассоциацию algos.

Другие вопросы по тегам