Описание тега featuretools
Featuretools - это библиотека Python для автоматизированного проектирования функций в наборах реляционных данных с использованием метода, называемого Deep Feature Synthesis.
0
ответов
Задание значения Popular_variables с помощью FeatureTools не работает
В настоящее время я работаю с документами по инструментам, используя мои собственные данные. Пока все работало нормально, но я застрял при добавлении интересных переменных. По некоторым причинам я не могу заставить это работать, и я не уверен почему…
05 окт '18 в 21:52
1
ответ
Как записать константы, полученные с помощью FeatureTools при использовании Deep Feature Synthesis
Когда FeatureTools выполняет глубокий синтез признаков, есть ли способ для записи постоянных значений, которые он получил? Например, у меня есть много строк, как это: | loan_id | loan_term | |---------|:---------:| | a | 12 | | ... | ... | | z | 18 …
22 окт '18 в 15:33
1
ответ
Избегайте дублирования столбца даты для дочерней сущности
У меня есть простой набор сущностей parent1 <- child -> parent2 и необходимость использования отрезанного кадра данных. Моя цель - parent1 и это доступно в любое время предсказаний. Я хочу указать date столбец только для parent2 так что это ti…
25 фев '19 в 18:29
1
ответ
Как исправить ошибки типа featurtools на colab
Как только я ввожу параметр time_index='date' в es.entity_from_dataframe(..) в приведенном ниже коде, ft.dfs(..) выдает длинный список ошибок, начиная с Type Error. Я использую Google Colab с FeatureTools версии 0.4.1. import pandas as pd import fea…
08 фев '19 в 13:40
1
ответ
Понимание примитивного вывода PercentTrue в featuretools
Я играл с учебным пособием по предикату-назначению-ношоу, и меня смущает вывод PERCENT_TRUE примитивный. Насколько я понимаю, после генерации функции столбец locations.PERCENT_TRUE(appointments.sms_received) дает процент строк, для которых sms_recei…
12 сен '18 в 21:38
1
ответ
Вручную определить "где пункт" из начальных функций?
Когда используешь ft.dfs чтобы получить определения характеристик, where_primitives Параметр фильтрует значения на основе интересных переменных объекта. Можно ли также вручную определить "где предложение" начального объекта?
29 мар '18 в 12:56
0
ответов
Отношения Featuretools и как сфокусировать мою цель
Я хотел бы лучше понять, что делается в отношениях с этим featuretools... Например, как я могу определить приоритеты своей цели и понять, как правильно думать о сущностях и как она будет действовать в моем преобразовании при применении DFS? Featuret…
10 июл '18 в 12:53
1
ответ
Как использовать Featuretools для создания объектов из нескольких столбцов в одном кадре данных по значениям столбцов?
Я пытаюсь предсказать результаты футбольных матчей на основе предыдущих результатов. Я использую Python 3.6 для Windows и использую Featuretools 0.4.1. Допустим, у меня есть следующий фрейм данных, представляющий историю результатов. Оригинальная Da…
02 дек '18 в 10:43
1
ответ
Создание объектов на основе времени отключения в FeatureTools
Я использую FeatureTools, и мне нужно создать функцию, которая использует время отсечки для его расчета. Мой набор сущностей состоит из клиентской таблицы и таблицы подписки (в ней больше, но для вопроса нужны только они): import featuretools as ft …
08 дек '18 в 20:15
1
ответ
Использование featuretools для создания "функций временного окна"
Я пытался автоматизировать создание "функций окна строки", используя featuretools пакет, но я не мог найти простой способ их создания. Что я имею в виду под "особенностями окна строки", так это то, что для каждого cutoff Я хочу создать объекты, кото…
14 дек '18 в 20:39
0
ответов
Функции не генерируются, как я ожидал бы в featuretools
Я новичок в featuretools и пытаюсь создать набор функций на основе цели с тем же index/time_index. Я хотел бы, чтобы сгенерированные функции использовали все данные до time_index target ниже. Итак, в приведенном ниже примере expected Значения данных…
21 янв '19 в 23:06
0
ответов
Проблема развертывания Featuretool
Мы пытаемся выяснить, как можно создавать объекты на новых тестовых данных, сохраняя и загружая определения объектов (созданные на основе обучающих данных). Мы создали объекты на целевом объекте для обучающих и тестовых данных, которые имеют первичн…
07 фев '19 в 04:29
1
ответ
Автоматическая генерация функций для задач временных рядов - Featuretools
Я пытаюсь использовать featuretools для создания функций, которые помогут мне предсказать количество посещений музея в следующем месяце. Могут ли featuretools генерировать функции для временных рядов? Должен ли я изменить данные так, чтобы идентифик…
17 фев '19 в 05:40
1
ответ
Как мне интерпретировать эту особенность
Допустим , у меня есть 3 объекта: parent1 <- child -> parent2. я использовал dfs() и получил особенность, которую я не могу понять MEAN(child.parent2.MEAN(child.num_feature)), Чтение документации, о которой я думал any_entity.MEAN функции как "групп…
23 фев '19 в 20:39
0
ответов
Запись пакета dask с фреймом данных на диск (создание 2 миллионов функций с помощью dask и featuretools)
Я очень новичок как в Dask, так и в Featuretools, поэтому у меня возникло много трудностей при их объединении для параллельной разработки функций. Короткая версия: решение насущной проблемы У меня есть сумка для напитков dfs из pandas DataFrame и хо…
27 фев '19 в 15:14
1
ответ
Используете dfs и Calculate_feature_matrix?
Вы могли бы использовать ft.dfs чтобы вернуть определения функций в качестве входных данных для ft.calculate_feature_matrix или вы могли бы просто использовать ft.dfs вычислить матрицу характеристик. Есть ли рекомендуемый способ использования ft.dfs…
11 мар '18 в 01:13
0
ответов
Использование featuretools для текстовых данных (количество слов, tfidf)
Featuretools лучше всего подходит для реляционных категориальных и числовых данных. Что касается текста, то кажется, что он учитывает только длину текста и некоторые другие основные характеристики. Как лучше всего подготовить текстовые данные для Fe…
06 фев '19 в 10:44
0
ответов
Как исправить ошибку
Я получаю эту ошибку при установке featuretools... почему? "NewConnectionError <'не удалось установить новое соединение: [Errno 11004] getaddrinfo fail',>
21 июн '18 в 11:12
0
ответов
Ошибка при установке featuretools на Mac
Спецификация системы: MacOS Mojava Версия:10.14.1 (18B75) Я пытаюсь установить featuretools на Mac с помощью пипа. Featuretools - это библиотека Python, используемая для создания нового набора функций с использованием существующих функций. Используе…
19 ноя '18 в 09:37
1
ответ
Пользовательские агрегирующие примитивы с дополнительными аргументами?
Примитив преобразования прекрасно работает с дополнительными аргументами. Вот пример def string_count(column, string=None): ''' ..note:: this is a naive implementation used for clarity ''' assert string is not None, "string to count needs to be defi…
01 июн '18 в 05:48