Как записать константы, полученные с помощью FeatureTools при использовании Deep Feature Synthesis
Когда FeatureTools выполняет глубокий синтез признаков, есть ли способ для записи постоянных значений, которые он получил?
Например, у меня есть много строк, как это:
| loan_id | loan_term |
|---------|:---------:|
| a | 12 |
| ... | ... |
| z | 18 |
DeepFeatureSynthesis инженеры features
в том числе <Feature: loan_term.COUNT(loan)>
как так:
| loan | loan_term | loan_term.COUNT(loan) |
|---------|:---------:|:---------------------:|
| a | 12 | 2000 |
| ... | ... | ... |
| z | 18 | 800 |
Я хотел бы иметь возможность реинжиниринга функций из одной организации, чтобы один срок кредита 12
имеет loan_term.COUNT(loan)
из 2000
без необходимости пересчитывать все loan_term
s в кадре данных.*
Я мог бы сделать это путем повторного объединения объекта с данными обученияft.calculate_feature_matrix(features, my_entity_set_with_one_new_entity_added)
, но это неэффективно и медленно.
Есть ли способ направить FeatureTools для записи констант, найденных во время глубокого синтеза объектов, и использовать их для будущего создания объектов?
* Для меня сейчас не важно включать в расчет единый новый кредитный объект. Так 12
не должен становиться 2001
,
1 ответ
К сожалению, нет способа сделать это в этом как Featuretools v0.3.1
, Вы можете сделать это вручную, выполнив следующие действия.
- Используя матрицу выходных объектов из данных обучения, выберите столбцы, которые вы не хотите пересчитывать, например:
loan_term.COUNT(loan)
, - Удалите функции, выбранные вами в 1. из вашего списка функций и работающие в новом наборе данных
- Присоедините кадр данных из шага 1 к кадру данных из шага 2 по соответствующему ключу. В этом случае
loan_term
,
Возможно, вам придется внести некоторые изменения в зависимости от особенностей вашего набора данных.