Как записать константы, полученные с помощью FeatureTools при использовании Deep Feature Synthesis

Когда FeatureTools выполняет глубокий синтез признаков, есть ли способ для записи постоянных значений, которые он получил?

Например, у меня есть много строк, как это: | loan_id | loan_term | |---------|:---------:| | a | 12 | | ... | ... | | z | 18 |

DeepFeatureSynthesis инженеры features в том числе <Feature: loan_term.COUNT(loan)> как так: | loan | loan_term | loan_term.COUNT(loan) | |---------|:---------:|:---------------------:| | a | 12 | 2000 | | ... | ... | ... | | z | 18 | 800 |

Я хотел бы иметь возможность реинжиниринга функций из одной организации, чтобы один срок кредита 12 имеет loan_term.COUNT(loan) из 2000 без необходимости пересчитывать все loan_terms в кадре данных.*

Я мог бы сделать это путем повторного объединения объекта с данными обученияft.calculate_feature_matrix(features, my_entity_set_with_one_new_entity_added), но это неэффективно и медленно.

Есть ли способ направить FeatureTools для записи констант, найденных во время глубокого синтеза объектов, и использовать их для будущего создания объектов?


* Для меня сейчас не важно включать в расчет единый новый кредитный объект. Так 12 не должен становиться 2001,

1 ответ

Решение

К сожалению, нет способа сделать это в этом как Featuretools v0.3.1, Вы можете сделать это вручную, выполнив следующие действия.

  1. Используя матрицу выходных объектов из данных обучения, выберите столбцы, которые вы не хотите пересчитывать, например: loan_term.COUNT(loan),
  2. Удалите функции, выбранные вами в 1. из вашего списка функций и работающие в новом наборе данных
  3. Присоедините кадр данных из шага 1 к кадру данных из шага 2 по соответствующему ключу. В этом случае loan_term,

Возможно, вам придется внести некоторые изменения в зависимости от особенностей вашего набора данных.

Другие вопросы по тегам