Описание тега k-fold

Метод перекрестной проверки, при котором данные разделяются на k подмножеств (или "складок"), где первые k-1 кратности используются для обучения, а последняя кратность - для оценки. Процесс повторяется k раз, каждый раз оставляя разные точки для оценки.
1 ответ

Способ сделать перекрестную проверку

Допустим, у меня есть fold1, fold2, fold3. Я тренировал Fold1, Fold2, Fold3 с моделью A. A) модель A (сложить 1) -> модель A (сложить 2) -> модель A (сложить 3) B) модель A (сгиб1) -> модель с сохраненным весом A (сгиб1) -> модель A (сгиб2) -> модел…
30 июн '19 в 17:14
0 ответов

Использование K-Fold для поиска лучшего K с возможной утечкой данных

Я использую набор данных Коби Брайанта.Я хочу предсказать shot_made_flag с участием KnnRegressor,Я пытаюсь избежать утечки данных, группируя данные по season, year, а также month, season уже существующий столбец и year а также month столбцы, которые…
0 ответов

Как использовать k-кратную перекрестную проверку в API обнаружения объектов

Я хотел бы знать, как я могу выполнить k-кратную перекрестную проверку с помощью API Tensorflow Object-Detection. В этом потоке переполнения стека: K свернуть перекрестную проверку Tensorflow Object Detection в комментарии упоминается, как использов…
26 авг '19 в 22:52
0 ответов

Pyspark ML: как получить значения подмоделей с помощью CrossValidator()

Я хотел бы получить cross-validation(внутренняя) точность обучения, используя PySpark конец ML библиотека: lr = LogisticRegression() param_grid = (ParamGridBuilder() .addGrid(lr.regParam, [0.01, 0.5]) .addGrid(lr.maxIter, [5, 10]) .addGrid(lr.elasti…
13 июл '19 в 01:46
0 ответов

Несколько метрик оценки в классификации с использованием пакета каретки

Я использую caret настроить MLP в 10-кратном резюме (повторяется 5 раз). Я хотел бы получить prSummary (F1, Precision, Recall), а также стандартные оценки точности и каппы в итоговом выводе. С caret::defaultSummary() Я получаю желаемую Точность и Зн…
0 ответов

K-кратная перекрестная проверка для мультикласса с 1 миллионами записей

Необходимо выполнить sklearn.model_selection.cross_validate с 1 миллионами точек данных. Классификатор должен быть мультиклассом и должен быть кратным классификации_report. Все сгибы должны запускаться параллельно на ОС Linux На 1 миллион записей бе…
2 ответа

Выберите образец из данных поезда на основе сгиба из k-кратной перекрестной проверки

Я провел k-кратную перекрестную проверку без пакета на основе здесь. Как разделить набор данных, чтобы выполнить 10-кратную перекрестную проверку без использования пакетов. Мне нужно выбрать 30% выборки из каждого сгиба в данных поезда. Вот моя функ…
18 июл '19 в 01:17
0 ответов

Нужно ли создавать новый классификатор для каждого сгиба при перекрестной валидации K-Fold?

Я пытаюсь обучить классификатор для выявления императивов. В моих данных 2000 императивов и 2000 необязательных. Я использовал 10% от 4000 (400) в качестве своего набора тестов, а остальные 3600 предложений - в качестве набора для обучения классифик…
13 авг '19 в 06:33
1 ответ

Получите индивидуальные оценки модели на каждой итерации / кратности в k-кратной проверке

Я пытаюсь выполнить проверку kfold в scala. Я использую модель случайного леса и rmse в качестве оценщика. Я могу получить значения rmse только для лучшей модели. Код: val rf = new RandomForestRegressor().setLabelCol("label").setFeaturesCol("feature…
31 июл '19 в 11:19
1 ответ

Предотвращение утечки данных с помощью синхронизированных данных и перекрестной проверки

Я использую набор данных Коби Брайанта.Я хочу предсказать shot_made_flag с участием KnnRegressor,Я пытаюсь избежать утечки данных, группируя данные по season, year, а также month, season уже существующий столбец и year а также month столбцы, которые…
0 ответов

Какой из них более надежный для glmnet Cox Model? LOOCV или K-кратная перекрестная проверка?

Когда я проверил статьи, чтобы найти метод определения предикторов общей выживаемости, в основном используется модель Кокса glmnet с штрафом Лассо и перекрестной проверкой. В качестве перекрестной проверки люди использовали 10-кратную перекрестную п…
31 авг '19 в 14:46
0 ответов

Как убедиться, что мой набор данных равномерно распределен по классам, т. Е. Он стратифицирован, размер и распределение классов должны быть сбалансированы?

Я сделал простой код перекрестной проверки K-fold, теперь я хочу внести некоторые изменения, чтобы он был сбалансирован по размеру и распределению классов?. PS: мне нужно использовать код Python с нуля, sklearn не допускается. from random import see…
27 июн '19 в 19:12
0 ответов

Как выполнить проверку groupKfold и сбалансировать данные?

Я разделяю некоторые данные в обучении и тестовом наборе согласно групповым значениям. Как я могу сделать это, чтобы иметь сбалансированные данные? Чтобы решить задачу двоичной классификации, у меня есть 100 образцов, каждый с уникальным идентификат…
0 ответов

Применить стратифицированную 10-кратную перекрестную проверку с использованием случайного леса

Я новичок в machine learning, у меня есть dataset без нормализации но я буду использовать StandardScaler в процессе. У меня мультикласс (класс 1, 2, ..., 10) Я хотел бы знать, как применить 10-кратную перекрестную проверку вместо train_test_split. #…
1 ответ

Как создать k-кратный перекрестный проверочный тест?

У меня есть данные от датчика загрязнения, которые я хочу проверить. Я сравниваю это с данными из londonair.org.uk, чтобы сравнить это. Я создал простую модель линейной регрессии с данными моего датчика по оси X и данными Londonair по оси Y и смог п…
0 ответов

как исправить "ValueError: обнаружены входные переменные с несовместимым количеством выборок: [2087, 4174]"

from sklearn.model_selection import KFold from sklearn.ensemble import RandomForestClassifier kf =KFold(n_splits=10, shuffle=True) print(type(kf)) features = ['f0','f1','f2','f3','f4','f5','f6','f7','f8','f9'] fold_idx=1 accrs= [] for train_idx, tes…
0 ответов

Альтернатива trainControl() из каретки в Python

У меня есть следующая функция trainControl в R: my_control<- trainControl(method="repeatedcv", number = 10, repeats=5, classProbs=T, summaryFunction = multiClassSummary, savePredictions = 'final') Я хочу реализовать подобное на Python с помощью S…
16 сен '19 в 16:03
1 ответ

Как сохранить оценку kfold с помощью cross_val_score()

Я хочу более четко понять kfold и то, как выбрать лучшую модель после того, как она будет реализована как метод перекрестной проверки. По данным этого источника: https://machinelearningmastery.com/k-fold-cross-validation/ шаги для выполнения kfold: …
0 ответов

Как применить K-кратную проверку в глубоком обучении?

Я новичок в этой теме. Как я могу применить перекрестную проверку на этом? X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.33, random_state=42) tokenizer = Tokenizer(num_words=MAX_NUM_WORDS) tokenizer.fit_on_texts(X_train) X_tr…
11 дек '19 в 17:50
1 ответ

Отличная RMSE от cross_validate и итерации Kfolds

Я хочу написать свою собственную функцию для перекрестной проверки, поскольку в этой ситуации я не могу использовать cross_validate. Исправьте меня, если я ошибаюсь, но мой код перекрестной проверки: cv = cross_validate(elastic.est,X,y,cv=5,scoring=…
23 ноя '19 в 20:01