NonePlyr - это пакет R с инструментами для решения множества проблем с использованием стратегии разделения-применения-объединения
1 ответ

Изменение формы данных в R . Можно ли иметь две "переменные значения"

Я борюсь с изменением формы пакета, ища способ "привести" к фрейму данных, но с двумя (или более) значениями в "value.var". Вот пример того, чего я хочу добиться. df <- data.frame( StudentID = c("x1", "x10", "x2", "x3", "x4", "x5", "x6", "x7", "x…
15 сен '12 в 11:36
1 ответ

Самый эффективный способ связать фреймы данных (более 10^8 столбцов) на основе имен столбцов

Как наиболее эффективно связать фреймы данных на основе имен столбцов? Все кадры данных не имеют одинаковых имен столбцов, поэтому я ожидаю, что в этом процессе будут введены значения NA. Вот воспроизводимый пример того, о чем я говорю, но имейте в …
08 апр '18 в 15:45
1 ответ

Новая перекрывающаяся переменная

Я не был уверен, что назвать это. У меня есть набор данных людей, лет и видов деятельности df <- data.frame("id" = c("1", "1", "1", "2", "2","3"), "years" = rep(1971, 6), "activity" = c("a","b","c","d","e","e")) id years activity 1 1 1971 a 2 1 1…
22 апр '12 в 17:12
2 ответа

Shapiro.test в R дает "все значения х одинаковы"?

Я работал над получением таблицы p-значений теста гипотезы нормальности Шапиро-Уилкса на моем фрейме данных. Вот кадр данных (с именем "mdf1") в виде CSV, разделенных запятыми. Тестирование Шапиро-Уилкса в R требует, чтобы размер выборки был больше …
15 авг '13 в 18:07
1 ответ

Colwise ест имена столбцов в ddply

Я пытаюсь разделить фрейм данных, найти случаи, когда фреймы суб-данных не сбалансированы, и добавить 0 значений для определенных уровней фактора, которые отсутствуют. Чтобы сделать это, в ddply я сделал быстрое сравнение с вектором набора того, как…
31 май '13 в 01:11
3 ответа

Как показать оверлей на Plyr (видеоплеер html5) в полноэкранном режиме?

У меня есть приложение, которое воспроизводит SVG с наложением тега vido HTMl5 (с помощью проигрывателя Plyr HTML5). Это прекрасно работает до тех пор, пока пользователь не нажмет опцию "Войти в полноэкранный режим". Это работало при использовании п…
10 окт '18 в 20:01
1 ответ

Ошибка "dims [product 0] не соответствует длине объекта" в R при использовании daply для подсчета частоты

У меня есть список data.frames, который выглядит следующим образом: df=data.frame( data_id=rep(LETTERS[1:10],each=1), data_value=c(1,2,2,3,3,2,3,1,1,3)) df2=data.frame( data_id=rep(LETTERS[1:10],each=1), data_value=c(2,1,3,1,1,1,2,1,2,1)) df3=data.f…
13 фев '13 в 15:48
1 ответ

Ошибка применения определенной функции ко всем строкам фрейма данных

Заранее извиняюсь, если до этого уже обращались, но я попытался просмотреть все вопросы, связанные с ddply, sapply и apply, и не могу на всю жизнь понять это... Я написал функцию countMonths, которая принимает день, месяц и общее количество дней в ц…
27 сен '12 в 20:03
1 ответ

Как вызвать функцию с аргументом dlply?

Я хочу написать функцию, используя dlply чтобы соответствовать линейной регрессии, стратифицированной "cat1 by arg1" Так что моя функция выглядит так fun1 <- function(arg1) { m1 <- data.frame(...) mod.var <- ... mod.form <- formula(paste…
27 май '11 в 10:33
1 ответ

R манипулирование данными

У меня есть следующий фрейм данных: head(d,20) place total error value 348 Telecolumbus_GmbH 2 2 2 349 telefonica 5 2 2 350 SOCO_SoftCom_Datensysteme 1 2 2 351 SWU_TeleNet_GmbH 1 2 2 352 dtag 5 2 2 353 dtag 23 2 14 354 Fachhochschule_Braunschweig/Wo…
04 апр '14 в 16:31
2 ответа

Добавьте флаг, который удовлетворяет определенным условиям во фрейме данных

Для каждого субъекта, если Cmax или AUC равен нулю, тогда FLAG должен быть равен 0. Если оба равны 1, тогда FLAG=1. SUB METRIC BE FLAG 1 Cmax 0 NA 1 AUC 1 NA 2 Cmax 1 NA 2 AUC 1 NA 3 Cmax 1 NA 3 AUC 1 NA 4 Cmax 1 NA 4 AUC 0 NA Вывод должен быть таки…
23 авг '17 в 06:01
0 ответов

Список списка фрейма данных в R

У меня действительно сложный тип данных, и я хотел бы преобразовать его во фрейм данных. Я использую lapply вот так, чтобы получать переводы из API вот так: localisedDestinationName <-lapply(uniqueLocationId[100:200], localisedDestinationNameForG…
12 мар '18 в 15:13
1 ответ

Выполнение расчетов на столбцах, созданных из ddply

Я использую ddply в subset рассчитать некоторые показатели и свернуть таблицу по мере необходимости. Некоторые из показателей, которые я хочу рассчитать, должны использовать обобщенные столбцы, созданные в результате ddply операция. Вот функция с пр…
09 ноя '14 в 21:30
2 ответа

Что означает точка в R - личные предпочтения, соглашение об именах или более?

Я (вероятно) не имею в виду "все другие переменные", что означает var1~. Вот. Мне указали на plyr еще раз и посмотрел в mlplyи задавался вопросом, почему параметры определяются с начальной точкой, как это: function (.data, .fun = NULL, ..., .expand …
23 сен '11 в 08:51
2 ответа

Работать с определенным количеством строк в data.table

Я работаю с таблицей данных, которая имеет группы данных и для каждой позиции (от -1000 до +1000) и подсчет для каждой позиции. Небольшой пример выглядит так: dt.ex <- data.table(newID=rep(c("A","B"), each = 6), pos=rep(c(-2:3), 2), count= sample…
20 авг '13 в 16:51
2 ответа

R: Группировка уровней фактора по нескольким файлам

Я новичок в R и изо всех сил пытаюсь сгруппировать несколько уровней фактора до расчета средних. Эта проблема осложняется тем, что я делаю это на сотнях файлов, которые имеют переменные уровни факторов, которые должны быть сгруппированы. Из предыдущ…
21 фев '13 в 20:52
3 ответа

Суммирование по строкам, содержащим определенные строки в R

У меня есть датафрейм, где первый столбец содержит названия кампаний. Мне нужно суммировать все строки, в которых названия кампаний содержат определенные строки (они могут появляться в разных местах имени, то есть иногда в начале, иногда в конце). Ф…
30 янв '15 в 08:53
1 ответ

Синтаксис dlply с t.test

Я ясно все еще не понимаю синтаксис plyr, как показано ниже. Может ли кто-нибудь помочь мне увидеть, что мне не хватает? Следующий код работает нормально, как и ожидалось: # make a data frame to use dlply on f <- as.factor(c(rep("a", 3), rep("b",…
10 мар '12 в 21:04
1 ответ

ddply - ошибка msg при группировании по двум переменным

Я борюсь с чем-то, что, на мой взгляд, должно быть довольно простым: приведенный ниже набор данных содержит, среди прочего, две переменные: epis.start и epis.end; основываясь на комбинации этих двух, я хотел бы назначить им переменную группировки, н…
22 авг '14 в 12:36
4 ответа

Агрегировать по категориям, которые содержат NA с ddply и lapply?

Я хотел бы объединить data.frame по 3 категориям, причем одна из них варьируется. К сожалению, эта одна изменяющаяся категория содержит NA (на самом деле это причина, по которой она должна меняться). Таким образом, я создал список data.frames, Кажды…
18 янв '12 в 16:24