Как получить Antecedents/Consequents из алгоритма FPGrowth в Pyspark?

Question

Как получить Antecedents/Consequents из алгоритма FPGrowth в Pyspark?

Как я неправильно использую / неправильно истолковываю использование алгоритма FPGrowth в Pyspark, у меня есть выходные данные алгоритма Apriori, которые я надеялся, что будет таким же. Предоставлен мой код FPGrowth, мой вывод Apriori и мой вывод FPGrowth.

from pyspark.mllib.fpm import FPGrowth
from pyspark import SparkConf
from pyspark.context import SparkContext
sc = SparkContext.getOrCreate(SparkConf().setMaster("local[*]"))
data = sc.textFile("C:\\Users\\marka\\Downloads\\Assig2.txt")
data.map(lambda line: line.strip().split())
transactions = data.map(lambda line: line.strip().split('\t'))
#notempty = transactions.map(lambda x: x is not '')
unique = transactions.map(lambda x: list(set(x))).cache()
model = FPGrowth.train(unique, minSupport=0.7, numPartitions=10)
result = model.freqItemsets().collect()
for fi in result:
    print(fi)

Априорный вывод:

FPGrowth выходной:

Я неверно истолковываю результаты или есть другой способ вывести FPGrowth, чтобы иметь возможность интерпретировать результаты как Apriori?

Для тестирования я использовал Weka для FPGrowth и получил результаты, аналогичные Apriori, поэтому указание на то, что мой метод вывода Pyspark неверен, но документация всегда для fi в результате: print(fi), так что я не уверен, как.

Weka FPGrowth выходной:

2

python-3.x machine-learning pyspark apache-spark-mllib fpgrowth

Источник

user9682236 27 июл '18 в 19:37

0 ответов

Другие вопросы по тегам python-3.x machine-learning pyspark apache-spark-mllib fpgrowth