Описание тега variable-selection

0 ответов

Автоматический выбор переменной

У меня есть набор данных со следующими столбцами Acres,FamilyType, NumBedrooms,NumChildren, NumPeople, NumRooms,NumUnits NumVehicles,NumWorkers, OwnRent,YearBuilt, HouseCosts,ElectricBill, FoodStamp,HeatingFuel,Insurance,Language, above_150K я сдела…
1 ответ

Функция шага для выбора переменной не работает

Я пытаюсь сделать выбор переменной, используя step() функция в R. Но он продолжает получать ошибку. Тогда я узнал, что сейчас нет основных step() функционировать как ранее. В шаговой функции есть lmerTest пакет для смешанных моделей. Кто-нибудь знае…
24 май '18 в 21:01
2 ответа

Автоматизация тестов lm со всеми возможными комбинациями var и получением значений для: shapiro.test(), bptest(),vif() в R

Я потратил дни на поиск оптимальных моделей, которые соответствовали бы всем стандартным допущениям OLS (нормальное распределение, гомоскедастичность, отсутствие мультиколлинеарности) в R, но с 12 переменными невозможно найти оптимальную комбинацию …
1 ответ

Метод автоматического выбора переменной

У меня есть набор данных по болезни, для этого набора данных. disease_rate является зависимой переменной, а остальные независимы. data <- read.csv("H:/uni/MS_DS/disease.csv") data > data radius texture perimeter area smoothness desease_rate 1 …
0 ответов

Функция для выбора переменных

Я хочу определить функцию для выбора переменной Var_Selection = function(data, target){ target = as.character(target) form = paste(target, '~ ') vect = c() valid.names <- names(data)[names(data) != "target"] myAIC = data.frame(var = as.character(…
16 апр '18 в 08:51
2 ответа

R: удалить / удалить мультиколлинеарные переменные, основываясь на результатах теста мультиколлинеарности

У меня есть набор данных из 32 переменных и 48 наблюдений (наблюдения будут увеличиваться, так как мы находимся в фазе сбора данных через подписки). Поскольку набор данных обладает высокой мультиколлинеарностью, я ввел тест Фаррара - Глаубера. Индив…
29 июл '18 в 06:25
1 ответ

В столбце выбора в кадре данных в пандах применяется функция min

У меня есть n-dataframe в списке df=[df_1, df_2, df_3, ...., df_n] Где df_n - это фрейм данных в пандах (python). df_n - это переменная моей керас-модели. X_train=[df_1_1,df_2_1,...,df_n_1] Куда: df_1_1 - первый фрейм данных списка (первая переменна…
1 ответ

Как применить анализ экстремальных границ к набору данных из более чем 100 переменных с помощью пакета ExtremeBounds в R?

У меня есть набор данных, состоящий из 107 переменных с 1794 наблюдениями. Я хочу реализовать Extreme Bounds Analysis, чтобы определить, какая из 106 переменных надежно коррелирует с зависимой переменной в широком диапазоне регрессий, каждая из кото…
22 ноя '18 в 21:02
0 ответов

Выбор предиктора кластерного анализа латентного класса

Я хочу выполнить скрытый кластерный анализ классов по 6 дихотомическим переменным и вычислить апостериорную вероятность принадлежности к классу для каждого массива ответов этих 6 переменных для каждого субъекта. Мои коды работают как минимум с 3 пер…
12 авг '18 в 19:10
0 ответов

Отрицательная биномиальная модель с лучшим подмножеством переменных

Какой пакет мне следует использовать, если я хочу разработать отрицательную биномиальную модель с лучшим подмножеством независимых переменных? У меня всего 140 независимых переменных, интересно, как найти лучшую модель за разумное время. Заранее спа…
01 мар '18 в 17:08
0 ответов

Можем ли мы использовать глубокие нейронные сети, такие как cnn, для выбора поднабора входных переменных для многомерной регрессии временных рядов?

Я хочу использовать CNN или LSTM для прямого выбора подмножества входных переменных и модели регрессии поезда для многомерных данных временных рядов. Набор данных состоит из m строк и n столбцов, указывающих m групп измерений от n датчиков. Таким об…
0 ответов

Выбор переменных для задачи классификации в CIC IDS 2017

Я играю с набором данных CIC IDS 2017. Я хочу сделать бинарную классификацию. Существует много переменных: некоторые из них являются двоичными, некоторые являются счетчиками (например, количество пакетов в направлении FWD), некоторые измеряют минима…
1 ответ

Выбор переменной в R

Я устанавливаю модель для поиска значимых переменных, используя выбор переменных. str(tweets2) 'data.frame': 6429 obs. of 13 variables: $ created_at : Factor w/ 5918 levels "1/10/2019 17:40",..: 56 53 52 51 50 49 48 47 46 45 ... $ screen_name : Fact…
09 апр '19 в 01:37
0 ответов

Последовательный выбор переменных и настройка гиперпараметров

У меня есть набор данных с кучей функций, большинство из которых связаны между собой. Таким образом, я хотел бы выполнить исключение некоторых переменных (например, с помощью RFE или же SelectKBest). Я обнаружил, что, если я выполню такой выбор пере…
0 ответов

R - Использование xgboost в качестве выбора функции, а также выбора взаимодействия

Допустим, у меня есть набор данных с большим количеством переменных (больше, чем в воспроизводимом примере ниже), и я хочу построить простую и интерпретируемую модель, GLM. Сначала я могу использовать модель xgboost и посмотреть на важность переменн…
1 ответ

Использование AIC для выбора переменных и оценки критерия множественной регрессии

Я новичок в R и Python. Мне нравится выполнять множественную регрессию с использованием информационного критерия Акаике для выбора переменных и оценки моего критерия. Я написал код для выбора моих переменных с использованием значения F статистики P.…
0 ответов

следует ли нам включать или исключать переменную в логистической регрессии на основе приведенного ниже описания?

Должны ли мы включать или исключать переменную в logit regr. модель, которая будет получать значения только в том случае, если произойдет определенное событие, в противном случае будет отображаться N/A? эта переменная сообщает, будет ли продукт купл…
19 апр '20 в 18:07
1 ответ

Выбор переменной в случайном лесу и точность прогноза

У меня есть набор данных поперечного сечения, повторяющийся в течение 2 лет, 2009 и 2010. Я использую первый год (2009) в качестве обучающего набора для обучения случайного леса для задачи регрессии, а второй год (2010) в качестве набора тестов.. За…
0 ответов

Выбор переменных, включающий сочетание числовых, высоких и низких кардинальных характеристик

Рассмотрим фиктивный фрейм данных: A B C D …. Z 1 2 as we 2 24 qq rr 5 4 5 tz rc 9 Этот фреймворк данных имеет 25 независимых переменных и одну целевую переменную, независимые переменные представляют собой смесь высших кардинальных признаков, числов…
0 ответов

Как я могу выбрать переменную с помощью HMSC-r?

Я хотел бы использовать пакет R HMSC, чтобы изучить, как сообщества меняются в зависимости от ландшафта. Я хотел бы сделать выбор переменных, чтобы определить, какие переменные среды важно сохранить в матрице XData. Судя по языку справки Hmsc(), каж…
25 мар '20 в 17:43