Описание тега feature-selection

В машинном обучении это процесс выбора подмножества наиболее важных функций для построения вашей модели данных.
0 ответов

Жадный выбор функций для предикации в г

Я новичок в R и пытаюсь выбрать лучшую функцию в наборе данных для предикации. Есть много возможностей на выбор, однако довольно сложный процесс запуска модели для каждой отдельной функции для сравнения лучших предикторов. Я слышал о выборе жадных ф…
22 окт '18 в 01:47
0 ответов

Для обучения модели дерева решений, как лучше обращаться с атрибутами, представленными вектором?

В большинстве инструкций, обсуждающих дерево решений, атрибуты представлены одним значением, а затем эти значения объединяются в виде вектора признаков. Это имеет смысл, поскольку обычно атрибуты независимы друг от друга. Однако на практике некоторы…
06 ноя '12 в 14:57
1 ответ

Python - конвейер sklearn SVC f_regression - получить имена столбцов

Я пытаюсь имена столбцов из этого фрагмента кода: anova_filter = SelectKBest(f_regression, k=10) clf = svm.SVC(kernel='linear') anova_svm = make_pipeline(anova_filter, clf) f_reg_features = anova_svm.fit(df_train, df_train_y) Я попробовал некоторые …
1 ответ

scikit-learn: получить выбранные функции при использовании SelectKBest в конвейере

Я пытаюсь сделать выбор функций как часть конвейера scikit-learn, в сценарии с несколькими метками. Моя цель состоит в том, чтобы выбрать лучшие K функций, для некоторых заданных k. Это может быть просто, но я не понимаю, как получить индексы выбран…
1 ответ

Нужна помощь в применении scikit-learn к этой несбалансированной задаче категоризации текста

У меня многоклассовая проблема классификации / категоризации текста. У меня есть набор наземных данных правды с K разные взаимоисключающие классы. Это несбалансированная проблема в двух отношениях. Во-первых, некоторые занятия намного чаще, чем друг…
1 ответ

Соединение склеарн конвейера + вложенная перекрестная проверка для регрессии КНН

Я пытаюсь выяснить, как построить рабочий процесс для sklearn.neighbors.KNeighborsRegressor это включает: нормализовать функции выбор функции (лучшее подмножество из 20 числовых функций, без конкретной суммы) перекрестная проверка гиперпараметра K в…
0 ответов

Есть ли особый дескриптор объекта, который представляет функцию цвета и текстуры?

Я хотел бы реализовать такой же процесс извлечения признаков в этой статье. То есть я хотел бы, чтобы извлеченные объекты были связаны с цветными и текстурными атрибутами изображения (и, возможно, с формой). Область интереса изображения уже сегменти…
1 ответ

Прерывистое сообщение об ошибке с метрикой ROC для rfe в карете

Я использую rfe in caret для выбора объектов на основе метрики ROC из twoClassSummary для модели логистической регрессии, созданной из несбалансированного набора данных (приблизительно 25:1). Чаще всего я получаю сообщение об ошибке. Иногда, однако,…
10 ноя '15 в 21:12
0 ответов

Ошибка выбора функции с помощью логического регрессора с использованием `rfe` из`caret`

Я выполнял выбор функции, используя rfe из пакета caret для линейной регрессии. Одним из моих регрессоров является логическая переменная, когда я делаю выбор функции с этой переменной, я всегда получаю Error in { : task 1 failed - "undefined columns…
17 мар '17 в 04:06
1 ответ

CV удаления рекурсивных функций в Sklearn изменяется при удалении функций

Я использую модуль RFECV в sklearn, чтобы найти оптимальное количество функций для получения максимальной перекрестной проверки в 2 раза. Я использую регрессор гребня в качестве моей оценки. rfecv = RFECV(estimator=ridge,step=1, cv=KFold(n_splits=2)…
0 ответов

Функции координат нейронной сети

В своей публикации " Жираф: использование глубокого обучения для игры в шахматы" Мэтью Лай пишет о представлении позиций шахматной игры в виде списка фигур и их координат, а не об использовании традиционного подхода для представления каждой 64 фишек…
1 ответ

Используйте sequentialfs с SVM в Matlab

Может кто-нибудь помочь мне с "sequentialfs "? Я не могу использовать его со следующими функциями SVM. "X" содержит характеристики каждого наблюдения, а "y" - классы каждого наблюдения. SVMModel = fitcsvm(X,Y); predict(SVMModel, X); При выполнении s…
15 апр '16 в 11:11
0 ответов

Мета-функции для задач классификации в Python

Я искал библиотеку, которая может извлечь некоторые мета-функции из данных. У нас есть нечто похожее на R под названием MFE ( Meta Feature Extractor), но я сейчас работаю с Python. Знаете ли вы какую-либо библиотеку на Python, которая имеет подобное…
2 ответа

Выбор функции на подмножествах набора функций

Я пытаюсь сделать выбор функции с помощью пакета Boruta в R. Проблема в том, что мой набор функций слишком велик (70518 функций), и, следовательно, кадр данных слишком велик (2 ГБ) и не может быть обработан пакетом Boruta сразу. Мне интересно, могу …
20 янв '17 в 11:53
0 ответов

Как передать функции модели Keras?

Я пытаюсь получить практический опыт работы с ML и научиться обучать модели, способной предсказывать пол по имени. Я векторизую имена (использовал три разных способа сделать это) и передаю их в качестве входных данных для модели, но, как бы я ни игр…
1 ответ

RandomForestRegressor, особенности функций

Я использую Random Forest Regressor и у меня есть 43 функции. Когда я запускаю следующий код: print(clf.feature_importances_) Я получаю следующий результат: [0. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0…
1 ответ

Сверточная нейронная сеть для зависящих от времени функций

Мне нужно сделать уменьшение размерности из серии изображений. Более конкретно, каждое изображение представляет собой снимок движущегося шара, и оптимальными характеристиками будут его положение и скорость. Насколько я знаю, CNN - это современное со…
1 ответ

Vowpal Wabbit Избыточность взаимодействия

Мне любопытно, как VW создает условия взаимодействия через параметр -q. Для этой иллюстрации я использую данные игрушки, которые называются cats.vm: 1 |a black |b small green |c numvar1:1.62 numvar2:342 |d cat |e numvar3:554 1 |a white |b large yell…
1 ответ

Выбор функций в Python

Я пытаюсь выполнить выбор функций в Python, используя несколько методов. Первая техника, которую я пытаюсь применить, - это выбор функций, используя только разнообразие функций. Мой код следующий: def feature_selection_technique(train, test, lbls, t…
06 июл '17 в 10:11
1 ответ

Расчет информационной выгоды с помощью Scikit-learn

Я использую Scikit-Learn для классификации текста. Я хочу рассчитать информационное усиление для каждого атрибута относительно класса в (разреженной) матрице термина документа. Информационный Прирост определяется как H(Класс) - H(Класс | Атрибут), г…