Рыночная корзина и кластеризация в Python
У меня большие панды DataFrame
это выглядит так:
OrderID OrderedItems ItemsQuantity
10052009 I0 2
10052009 I1 1
10052009 I2 1
10052009 I3 1
10448900 I4 5
10448900 I5 5
10189322 I2 1
10189322 I2 1
Теперь я хочу узнать, какие все предметы заказаны вместе и преобладают связки.
1 ответ
Я предполагаю, что вы знакомы с алгоритмами кластеризации и т. Д. Вы можете использовать эти данные, и с помощью sklearn, пожалуйста, запустите K Means на любом другом алгоритме кластеризации.
http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
PS: Я предполагаю, что это всего лишь образец данных.
Далее аналогичным образом вы можете запустить ассоциацию algos.