Задание значения Popular_variables с помощью FeatureTools не работает
В настоящее время я работаю с документами по инструментам, используя мои собственные данные. Пока все работало нормально, но я застрял при добавлении интересных переменных. По некоторым причинам я не могу заставить это работать, и я не уверен почему. Пример в документе работает просто отлично.
После создания набора сущностей я пытаюсь получить функции для конкретного продукта. Classic Cars
:
## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]
## Get features
feature_defs = ft.dfs(entityset=es,
target_entity="customers",
agg_primitives=["count"],
where_primitives=["count"],
trans_primitives=[],
features_only=True))
## Show features
feature_defs
OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]
То, что я ожидал бы, является функцией, где это подсчитывает количество транзакций, которые включают Классические Автомобили. К сожалению, этого не происходит. Он также не работает с любой другой переменной или значением, которое я пробовал.
Как вы можете видеть здесь, задание сработало.
es["products"]["PRODUCTLINE"].interesting_values
OUT[2]: ['Classic Cars']
А у Classic Cars есть действительное значение переменной PRODUCTLINE:
es["products"].variables
OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
<Variable: PRODUCTLINE_ID (dtype = numeric)>,
<Variable: PRODUCTLINE (dtype = categorical)>,
<Variable: MSRP (dtype = numeric)>]
es["products"].df.PRODUCTLINE.head(2)
OUT[4]: S10_1678 Motorcycles
S10_1949 Classic Cars
Name: PRODUCTLINE, dtype: object
Не уверен, что я делаю неправильно, и любая помощь будет оценена!
Вот данные и код, если вы хотите воспроизвести их: https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco