Как мне интерпретировать эту особенность
Допустим , у меня есть 3 объекта: parent1 <- child -> parent2. я использовал dfs()
и получил особенность, которую я не могу понять MEAN(child.parent2.MEAN(child.num_feature))
, Чтение документации, о которой я думал any_entity.MEAN
функции как "группа по сущности, а затем применить MEAN", но теперь этот подход не работает
1 ответ
Deep Feature Synthesis создает новые функции, "укладывая" существующие функции. Чтобы понять эту функцию, давайте пройдемся по шагам, как это рассчитывается.
- Рассчитать особенность
MEAN(child.num_feature)
и добавить его вparent2
, - Присоединиться к этой функции (определено на
parent2
) вchild
, Это создает новую функциюparent2.MEAN(child.num_feature)
определено наchild
, Рядыchild
которые имеют одинаковое значение для `parent2 ', будут иметь то же значение для этой функции. - Сгруппировать
child
отparent
и принять среднее значение этой функции. Это создаетMEAN(child.parent2.MEAN(child.num_feature))
Чтобы уточнить, давайте рассмотрим конкретный пример
Представить parent1
был стол клиентов, child
был стол transactions
ваши клиенты с колонкой amount
, а также parent2
была таблица каждого уникального продукта, который вы продаете.
Особенность MEAN(transactions.product.SUM(amount))
созданная для клиентов сущность может быть интерпретирована как "какова средняя общая сумма продаж продуктов, купленных этим клиентом", например "покупает ли этот клиент продукты, которые были проданы много".