Задание значения Popular_variables с помощью FeatureTools не работает

В настоящее время я работаю с документами по инструментам, используя мои собственные данные. Пока все работало нормально, но я застрял при добавлении интересных переменных. По некоторым причинам я не могу заставить это работать, и я не уверен почему. Пример в документе работает просто отлично.

После создания набора сущностей я пытаюсь получить функции для конкретного продукта. Classic Cars:

## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]

## Get features
feature_defs = ft.dfs(entityset=es,
                            target_entity="customers",
                            agg_primitives=["count"],
                            where_primitives=["count"],
                            trans_primitives=[],
                            features_only=True))

## Show features
feature_defs


OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]

То, что я ожидал бы, является функцией, где это подсчитывает количество транзакций, которые включают Классические Автомобили. К сожалению, этого не происходит. Он также не работает с любой другой переменной или значением, которое я пробовал.

Как вы можете видеть здесь, задание сработало.

es["products"]["PRODUCTLINE"].interesting_values

OUT[2]: ['Classic Cars']

А у Classic Cars есть действительное значение переменной PRODUCTLINE:

es["products"].variables

OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
 <Variable: PRODUCTLINE_ID (dtype = numeric)>,
 <Variable: PRODUCTLINE (dtype = categorical)>,
 <Variable: MSRP (dtype = numeric)>]

es["products"].df.PRODUCTLINE.head(2)

OUT[4]: S10_1678     Motorcycles
S10_1949    Classic Cars
Name: PRODUCTLINE, dtype: object

Не уверен, что я делаю неправильно, и любая помощь будет оценена!

Вот данные и код, если вы хотите воспроизвести их: https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco

0 ответов

Другие вопросы по тегам