Описание тега data-manipulation

Манипулирование данными - это процесс изменения данных из менее полезного состояния в более полезное состояние.
1 ответ

Как удалить всех участников в R, которые встречаются только с одним уровнем переменной, а не со вторым?

Я анализирую набор данных интернет-сообщества с R. Я буду очень признателен за вашу помощь, так как застрял в одной проблеме. Вот схема: Набор данных: имя пользователя каждого пользователя доступно. Каждая строка представляет активность одного польз…
31 мар '16 в 15:58
2 ответа

Условно заменить значения в следующем ряду

Как я могу написать условную функцию, которая сравнивает записи в строках фрейма данных в R. Например, если запись в строке 1 больше, чем запись в строке 2, замените запись строки 2 на "нижнюю" row1 row2 667 668 673 674 665 679 664 668 Записи в перв…
15 дек '15 в 00:54
3 ответа

Поиск и суммирование значений, связанных с разными идентификаторами

У меня есть файл, который включает значение депрессии, связанное с каждым уникальным значением идентификатора. Фрейм данных с именем HAVE выглядит следующим образом: id depression friendid_A friendid_B friendid_C friendid_D 1 1.0 NA 3 6 5 2 0.6 6 4 …
26 апр '18 в 02:15
1 ответ

R: преобразовать значения в формат с разделителями

Я пытаюсь создать словарь данных RedCap из вывода SPSS. SPSS перечисляет допустимые значения или факторы для каждой переменной следующим образом: SEX 0 Male 1 Female LANGUAGE 1 English 2 Spanish 3 Other 6 Unknown Как я могу преобразовать вышеупомяну…
20 июн '18 в 13:51
2 ответа

Управление объектом mcmc.list в R

Я использовал JAGS, вызванный через rjags, для создания объекта mcmc.list foldD_samples, который содержит мониторы трассировки для большого количества стохастических узлов (>800 узлов). Теперь я хотел бы использовать R для вычисления довольно сложно…
15 ноя '15 в 15:54
0 ответов

R: Объединить две таблицы по некоторому предикату

У меня есть следующие таблицы в R: Sample X Y Z ... Sample1 1.5 2.32 123.1 Sample2 1.2 4.22 23.2 Sample3 0.82 531 543.2 . . . - Cluster X Y Z ... 1 1.5 2.32 123.1 2 1.2 4.22 23.2 3 0.82 531 543.2 . . . Я хотел бы объединить таблицы так Sample Cluste…
21 мар '18 в 13:50
1 ответ

Удалить строки в зависимости от режима

Данные: df <- data.frame("y"= c(rep(100,10), rep(103,10)), "x" = c(rep(1,8),2,2,rep(4,5),7,7, rep(4,3)) ) Для каждого значения у мы ожидаем уникальное значение х. Но в данных у нас есть пара нежелательных значений. Основываясь на режиме, мы можем…
26 апр '16 в 05:22
1 ответ

na.string в read.csv и функция ifelse в dplyr::mutate

Я использовал 2 способа импортировать данные (в формате CSV) в R. Первый метод не имеет na.string аргумент, а второй имеет. Я использовал второй, потому что некоторые строки выглядели как "" вместо NA после импорта, и что я хочу стандартизировать вс…
19 июл '16 в 07:09
1 ответ

Добавление вновь созданных переменных в существующий фрейм данных в Python Pandas

Я хотел бы создать функцию SplitName(), которая 1) преобразует все буквы в нижний регистр, 2) разделяет запись имени по пробелам (т. Е. "Джон Сноу" на "Джон" и "Сноу") и 3) создает данные кадр в Pandas, который принимает разделенные имена и создает …
18 ноя '14 в 06:49
1 ответ

Быстрый способ разбить строку и преобразовать в длинный формат в data.table

Я делаю следующее library(data.table) library(stringr) dt <- data.table(string_column = paste(sample(c(letters, " "), 500000, replace = TRUE) , sample(c(letters, " "), 500000, replace = TRUE) , sample(1:500000) , sep = " "), key = "string_column"…
27 мар '14 в 04:20
0 ответов

Применить значения столбцов факторов к новым столбцам в R

Проделал обширный поиск, но не смог найти решение. У меня есть датафрейм, который выглядит так: FAC | NUM | VAL A | 1 | 100 A | 2 | 200 B | 1 | 300 B | 2 | 200 И я хочу, чтобы это выглядело так: NUM | A | B 1 | 100 | 300 2 | 200 | 200 Есть ли просто…
10 авг '17 в 04:22
1 ответ

Сводные катеорические значения в логические столбцы SQL

Я пытаюсь "сгладить" свой набор данных для облегчения анализа данных. Каждый категориальный столбец должен быть изменен на несколько логических столбцов. У меня есть столбец с категориальными значениями, например: ID col1 1 A 2 B 3 A Я ищу способ по…
1 ответ

Запись нескольких переменных

Я пытаюсь перекодировать создание новых переменных на основе уже существующих переменных. Следующий код - это то, что я придумал. Есть ли лучший способ сделать это? Например, мне нужно заранее создать отдельную матрицу или можно легко создавать новы…
05 авг '13 в 09:15
1 ответ

Renamng и удаление конкретных NA в наборе данных в R

Я довольно новичок в этом, и я мог бы использовать некоторую помощь. Мне нравится достигать двух вещей в R. На данный момент у меня есть набор данных, называемый "исследовательские данные". 1. Мне нравится манипулировать данными в одном конкретном с…
01 июл '17 в 12:30
1 ответ

$_POST отвечает обратно на веб-страницу и как обращаться с данными на динамической веб-странице

Я довольно новичок в php, так что эта функциональность ставит меня в тупик, я дам вам картину для контекста. Схема применения для опорного изображения Таким образом, я могу запросить свою базу данных и установить каждый бит данных в отдельную переме…
1 ответ

Скользящие временные интервалы для данных временных рядов в R

Я пытаюсь извлечь интересную статистику для нерегулярного набора данных временных рядов, но не могу найти правильные инструменты для этой работы. Инструменты для манипулирования регулярно выбираемыми временными рядами или индексными рядами в любое в…
05 май '12 в 21:08
0 ответов

Несколько data.frames от одного с почти случайным критерием выбора

Это следующий вопрос из Извлечь несколько фреймов данных из одного с критериями выбора. Допустим, данные такие же, как в приведенном выше примере df <- data.frame(x1 = runif(1000), x2 = runif(1000), x3 = runif(1000), split = sample( c('SPLITMEHER…
17 май '17 в 10:11
1 ответ

R: как сдвигать столбцы в зависимости от условий

У меня есть набор данных, подобный следующему, и для каждой строки я хочу сместить некоторые столбцы в зависимости от условия. flv1 attr1_1 attr2_1 flv2 atrr2_1 atrr2_2 flv3 atrr3_1 atrr3_2 1 3 4 3 4 2 2 2 5 2 3 4 3 4 2 1 5 5 1 3 4 3 4 2 2 4 5 и рез…
21 июл '16 в 02:23
1 ответ

Преобразовать список смежности в разреженную матрицу смежности, используя python

При использовании scipy мне удалось преобразовать мои данные в следующем формате: (row, col) (weight) (0, 0) 5 (0, 47) 5 (0, 144) 5 (0, 253) 4 (0, 513) 5 ... (6039, 3107) 5 (6039, 3115) 3 (6039, 3130) 4 (6039, 3132) 2 Как я могу преобразовать это в …
30 мар '16 в 22:54
2 ответа

Извлечение с именами, когда имена повторяются

Я столкнулся с этим вызовом. Как извлечь, когда есть повторение в именах? X <- 1:5 names(X) <- c(letters[1:4], "a") X a b c d a 1 2 3 4 5 names(X) [1] "a" "b" "c" "d" "a" X["a"] a 1
03 авг '16 в 08:21