Описание тега gridsearchcv

Этот тег предназначен для вопросов о процессе выполнения исчерпывающего поиска по заданным значениям параметров для оценщика с использованием класса GridSearchCV из библиотеки Python scikit-learn.
1 ответ

Внутреннее масштабирование тренировочных данных во время CV с использованием GridSearchCV для оптимизации гиперпараметров

Я пытаюсь выполнить оптимизацию гиперпараметра SVM с помощью GridSearchCV. Предположим, я передаю эту функцию с данными и метками обучающего набора (разделение теста уже изолировано перед вызовом функции). def param_search(X, y): Cs = 10. ** np.aran…
14 фев '19 в 07:42
0 ответов

randomSearchCv/gridSearchCv заморозить с помощью n_jobs>1

Если я использую gridSearchCv с nJobs>1, мой код, кажется, зависает: процессы все еще работают, но не используют процессор, кажется, они в ожидании. Я не знаю, как решить эту проблему, пожалуйста, помогите мне. --- modulename: selectors, funcname: s…
31 янв '19 в 07:46
1 ответ

GridSearchCV фитинг

У меня проблемы с подбором классификатора с использованием бинаризованных меток. clf_linear = GridSearchCV(SVC(kernel='linear', class_weight='balanced'), param_grid, cv=5) clf_linear = clf_linear.fit(X_train_pca, y_train) y_train был преобразован в …
25 ноя '18 в 17:56
0 ответов

Пиксельная классификация нейронной сети

Я пытаюсь устранить ошибку в ситуации настройки гиперпараметра: Изображения, которые я пытаюсь обработать, имеют форму (64, 64, 3) (ширина, высота, каналы). Соответствующие метки имеют форму (64, 64, 1) так как я делаю задачу двоичной классификации,…
1 ответ

Использование множественной оценки метрик с GridSearchCV

Я пытаюсь использовать несколько метрик в GridSearchCV. Мой проект нуждается в нескольких показателях, включая "точность" и "оценка f1". Однако, следуя моделям sklearn и онлайн-сообщениям, я не могу заставить свою работу работать. Вот мой код: from …
29 дек '18 в 21:44
0 ответов

Пользовательская функция потерь с классификатором adaboost

У меня есть данные и код, как пример данных и код ниже. В коде у меня есть два примера, в одном из которых я определяю пользовательскую функцию потерь и обучаю классификатор нейронной сети. И еще один пример кода, где я определяю пользовательскую фу…
20 янв '19 в 22:37
1 ответ

Разделение данных в Python таким образом, что каждый субъект остается в один раз (перекрестная проверка m раз)

Так вот в чем дело. Я применяю бинарный классификатор для 5 пациентов (P1,P2,...P5). У каждого пациента есть 100 образцов данных, и результат равен либо 0, либо 1. Поэтому я отложил одного пациента (скажем, P5) в качестве данных тестирования и испол…
0 ответов

Склеарн Джоблиб с n_jobs

При использовании scikit-learn parallel_backend можно указать количество заданий, запускаемых через n_jobs: from sklearn.externals import joblib with joblib.parallel_backend(n_jobs=2): searchcv_1.fit() Однако, поскольку у меня несколько ядер, я бы х…
05 фев '19 в 17:28
0 ответов

Выводит вывод GridsearchCV при использовании KNNClassifier в качестве estrimator и алгоритма как kd_true

Я использую GridsearchCV для настройки параметров. Я использую оценку KNNClassifier с алгоритмом kd_tree. Единственный параметр, который я настраиваю, это n_neighbours, которые я передаю в сетке параметров. Вывод, который я получаю, показан ниже KNN…
10 фев '19 в 11:18
1 ответ

Как установить собственную оценку с помощью GridSearchCV из sklearn для регрессии?

Я использовал GridSearchCV(...scoring="precision"...) для модели классификации. и теперь я собираюсь использовать GridSearchCV для модели регрессии и установить оценку с собственной функцией ошибок. Пример кода: def rmse(predict, actual): predict = …
01 дек '18 в 03:49
0 ответов

Сетка поиска CV в Python

Я начал работу по настройке гиперпараметров XGBoost, я пытаюсь подогнать 10 раз для каждого параметра 1944 года, используя только один PCU. Работа выполнялась более трех дней. Мой вопрос: есть ли способ узнать, когда работа закончится и сколько врем…
31 дек '18 в 20:39
1 ответ

Stacking StandardScaler() с помощью RFECV и GridSearchCV

Итак, я обнаружил, что StandardScaler() может ускорить выполнение моего RFECV внутри моего GridSearchCV при каждой вложенной 3-кратной перекрестной проверке. Без StandardScaler() мой код работал более 2 дней, поэтому я отменил и решил ввести Standar…
07 янв '19 в 14:49
0 ответов

OSError: [Errno 28] На устройстве не осталось места

Когда в какой-то момент я запускаю программу на python с gridSearch или randomSearch, я получаю эту ошибку, что это значит и как ее решить? Там много места на диске, 32 ГБ оперативной памяти, и я не знаю, как это могло произойти. File "/home/tombari…
31 янв '19 в 16:10
0 ответов

GridsearchCV: scoring='precision' возвращает ошибку

Я тренируюсь, чтобы принимать дерево решений на основе данных радужной оболочки. Я хочу использовать GridsearchCV, чтобы дать мне наилучшие возможные параметры дерева. По умолчанию оценка является точной. И это хорошо работает (96%). Но когда я пыта…
22 ноя '18 в 13:15
0 ответов

Ошибка типа: "<" не поддерживается между экземплярами "str" и "int" для gridsearchcv

Я использую свою модель, используя sklearn Pipeline, но когда я запускаю GridSearchCV чтобы получить мои лучшие параметры, я получаю ошибку. Я использую преобразователь категории, чтобы указать мои числовые и категориальные переменные. Затем запусти…
1 ответ

Конвейер sklearn: запуск TfidfVectorizer на полном обучающем наборе перед применением TimeSeriesSplit внутри GridSearchCV?

Я уверен, что это возможно, но я не смог понять это. Дайте учебный набор данных, используя TimeSeriesSplit с num_split=5, расколы выглядят так: [0] : [1] [0 1] : [2] [0 1 2] : [3] [0 1 2 3] : [4] [0 1 2 3 4] : [5] Проблема в первых парах проходит, T…
0 ответов

Ошибка в пользовательской функции оценки для xgboost, которая будет использоваться в gridsearchcv

Я использую пользовательскую функцию в gridsearchcv. Функция для расчета отзыва в топ2 децилях. Но я получаю ошибку ниже, пока я бегу grid_search.fit(): Ошибка типа: my_custom_func() отсутствует 1 обязательный позиционный аргумент: 'y' Код следующим…
08 фев '19 в 14:14
1 ответ

Сделать собственный счетчик с GridSearchCV

У меня есть код ниже, где я пытаюсь использовать собственный счетчик, я определил "custom_loss_five" с GridSearchCV для настройки гиперпараметров. У меня есть пример кода ниже. У меня также есть некоторые образцы данных. Я получаю сообщение об ошибк…
20 янв '19 в 01:09
1 ответ

GridSearchCV - Ошибка: значение истинности массива с более чем одним элементом является неоднозначным. Используйте a.any() или a.all()

Я пытаюсь сделать классификацию нейронных сетей, используя scikit-learn в питоне. Я сгенерировал свои данные, разделил их для обучения и тестирования и использовал их в модели MLPClassifier(), Далее я планирую оценить параметры, используемые в этой …
03 янв '19 в 19:31
2 ответа

Реализация пользовательской функции потерь в Scikit Learn

Я хочу реализовать пользовательскую функцию потерь в Scikit Learn. Я использую следующий фрагмент кода: def my_custom_loss_func(y_true,y_pred): diff3=max((abs(y_true-y_pred))*y_true) return diff3 score=make_scorer(my_custom_loss_func,greater_ is_bet…