Описание тега dummy-variable

Фиктивные или индикаторные переменные используются для включения категориальных или качественных переменных или факторов в регрессионную модель на языке программирования R для статистических вычислений, биоинформатики и графики.
3 ответа

Преобразовать фрейм данных с фиктивными переменными в категориальные переменные

Мне нужно преобразовать пустышку в категориальные переменные. Будучи новичком в R, я просто знаю, как сделать это наоборот. Может ли кто-нибудь указать мне правильное направление? Фрейм данных: data <- data.frame(id=c(1,2,3,4,5,6,7,8,9), red=c("1…
03 сен '18 в 03:26
1 ответ

Убрать режимы индикатора, которые меньше трех периодов

Я ищу помощь по следующей проблеме. Предположим, у меня есть переменная индикатора: ind <- c(0,1,1,1,0,0,0,0,0,1,0,0,1,1,0,0,0,0,1,1,1,1,1,0,0,0,1,1,0) Моя переменная индикатора намного длиннее, так что это не особая проблема. Я заинтересован в н…
02 сен '15 в 16:13
1 ответ

R: добавление столбца фиктивной переменной в объект xts timeseries

У меня есть объект временного ряда xts, составленный из ежеминутных данных внутридневной торговли за 2015 год. Я хотел бы добавить фиктивную переменную, обозначающую 1 как день события или 0 как день без событий. Поскольку фиктивная переменная по св…
16 окт '16 в 22:59
3 ответа

Создание категориальных переменных из взаимоисключающих фиктивных переменных

Мой вопрос касается разработки ранее отвеченного вопроса о объединении нескольких фиктивных переменных в одну категориальную переменную. В ранее заданном вопросе категориальная переменная была создана из фиктивных переменных, которые НЕ были взаимои…
21 апр '13 в 19:31
1 ответ

R - недостаточно памяти при преобразовании в фиктивные переменные

У меня есть набор данных с категориальной переменной с ужасным количеством уровней (5000 или около того). Когда я запускаю свой код для преобразования в фиктивные переменные, он говорит, что ему нужно 22 гигабайта памяти и вылетает dmy <- dummyVa…
03 ноя '15 в 04:19
1 ответ

Создание фиктивной переменной на основе свойств группы

Мои данные выглядят примерно так: ID CSEX MID CMOB CYRB 1ST 2ND 1 1 1 1 1991 0 1 2 1 1 7 1989 1 0 3 2 2 1 1985 1 0 4 2 2 11 1985 0 1 5 1 2 9 1994 0 0 6 2 3 4 1992 1 0 7 2 4 2 1992 0 1 8 1 4 10 1983 1 0 С ID = ID ребенка, CSEX = пол ребенка, MID = ID…
06 авг '16 в 15:58
2 ответа

Функция lm в R исключает 1 фиктивную переменную

У меня есть датафрейм, который выглядит так: Date A B MONTH 2016-01-01 3 10 January 2016-01-02 5 13 January 2016-01-03 8 12 January . . . 2016-12-29 4 13 December 2016-12-30 5 12 December 2016-12-31 6 4 December С этим фреймом данных я хочу запустит…
10 ноя '17 в 17:31
1 ответ

Python Pandas: генерировать фиктивную переменную из числовой переменной в соответствии с порогом

Цель состоит в том, чтобы создать новый столбец из df с 1, если значение из столбца "% Renewable" равно или выше медианы, и 0, если значение ниже медианы. df = pd.DataFrame({'% Renewable': [np.NaN, 12, np.NaN, 11, 17, 62, 18, 15, np.NaN, 2, np.NaN, …
20 дек '16 в 11:43
1 ответ

R числовые и категориальные переменные в множественной линейной регрессии

У меня есть фрейм данных, который выглядит примерно так: BMI<-c(13.4,14,15.6,16,13.4,12.9,17.7,18.3,17,16.5) sport<-c(1,2,2,3,2,1,1,3,1,2) social<-c("low","middle","middle","low","high","low","middle","middle","high","middle") smoker<-c(…
1 ответ

R: Создание фиктивных переменных для значений одной переменной, условно другой переменной

ОРИГИНАЛЬНЫЙ ВОПРОС Я хочу добавить ряд фиктивных переменных в фрейм данных для каждого значения x в этом фрейме данных, но содержащий NA, если другой переменной является NA. Например, предположим, у меня есть следующий кадр данных: x <- seq(1:5)…
20 июн '16 в 15:00
2 ответа

Преобразование категориальных данных в набор пустышек

У меня есть данные, как это:- |--------|---------| | Col1 | Col2 | |--------|---------| | X | a,b,c | |--------|---------| | Y | a,b | |--------|---------| | X | b,d | |--------|---------| Я хочу преобразовать эти категориальные данные в фиктивные п…
13 фев '19 в 13:26
1 ответ

Сингулярность во взаимодействующих категориальных переменных в r

Я пытаюсь оценить модель, которая имеет много взаимодействующих категориальных переменных. Тем не менее, я получаю ошибки сингулярности, когда я делаю OLS. Я пытаюсь понять, почему. Я думаю, что я делаю что-то не так с установкой переменных в R. мод…
01 янв '18 в 08:30
7 ответов

Создать фиктивный столбец на основе других столбцов

Допустим, у меня есть этот набор данных > example <- data.frame(a = 1:10, b = 10:1, c = 1:5 ) Я хочу создать новую переменную d, Я хочу в d значение 1, когда хотя бы в переменных a b c значение 1, 2 или 3 присутствует.d должен выглядеть так: d…
27 апр '18 в 09:36
5 ответов

Как заставить R использовать указанный уровень фактора в качестве эталона в регрессии?

Как я могу сказать R использовать определенный уровень в качестве ссылки, если я использую двоичные объясняющие переменные в регрессии? Он просто использует какой-то уровень по умолчанию. lm(x ~ y + as.factor(b)) с b {0, 1, 2, 3, 4}, Допустим, я хоч…
3 ответа

Мне приходится создавать фиктивные переменные таким специфическим способом. Может кто-нибудь помочь мне упаковать этот код в функцию?

respect$BB6_cat5_0 <- ifelse(respect$BB6_cat5 == 1, 1, 0) respect$BB6_cat5_1 <- ifelse(respect$BB6_cat5 == 2, 1, 0) respect$BB6_cat5_2 <- ifelse(respect$BB6_cat5 == 3, 1, 0) respect$BB6_cat5_3 <- ifelse(respect$BB6_cat5 == 4, 1, 0) respe…
11 янв '18 в 15:19
2 ответа

Работа со связями, используя ранг (R)

Я пытаюсь создать фиктивную переменную для того, родился ли ребенок первым, и для переменной, если ребенок родился вторым. Мои данные выглядят примерно так ID MID CMOB CYRB 1 1 1 1991 2 1 7 1989 3 2 1 1985 4 2 11 1985 5 2 9 1994 6 3 4 1992 7 4 2 199…
06 авг '16 в 13:39
1 ответ

Создать фиктивную переменную выходных в еженедельных данных на основе столбца Дата, где Дата представляет конец недели

У DF есть даты конца недели. df <- data.frame(Date=seq(as.Date("2014-01-03"), as.Date("2020-12-25"), by="week")) df$week <- seq(nrow(df)) df <- df[, c("week", "Date")] head(df) #> week Date #> 1 1 2014-01-03 #> 2 2 2014-01-10 #>…
03 май '18 в 08:24
0 ответов

Создание фиктивной переменной на основе строковых значений в другой переменной

Я пытаюсь создать фиктивную переменную, основанную на строковом значении другой переменной, в новую фиктивную переменную входят составные слова. Мой вопрос заключается в том, как обойти это, чтобы оно включало только слова в кавычках. Пример синтакс…
19 фев '18 в 22:07
2 ответа

Кусочно-линейная регрессия с ограничением - r

Я пытаюсь сделать кусочно-линейный анализ регрессии OLS в R с одной точкой останова. У меня есть следующая формула регрессии и ограничения: Где D - манекен Я хотел бы наложить ограничение, чтобы линии регрессии были непрерывными (с точкой разрыва). …
08 июн '18 в 16:42
5 ответов

Get_dummies Панды против OneHotEncoder() Sklearn ():: Что является более эффективным?

Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummies метод и sklearn.preprocessing.OneHotEncoder() и я хотел посмотреть, как они отличаются с точки зрения…