Описание тега tapply

NoneTapply - это функция на языке программирования R для применения функции к подмножествам вектора.
3 ответа

Удалить NA из списка списков

У меня есть матрица data.mat, которая выглядит так: A B C D E 45 43 45 65 23 12 45 56 NA NA 13 4 34 12 NA Я пытаюсь превратить это в список списков, где каждая строка представляет собой один список в большем списке. Я делаю следующее: list <- tap…
11 сен '14 в 00:18
1 ответ

Гнездо применить функцию в Tapply

Я хотел бы использовать tapply сгруппировать результат функции по переменной. Функция, которую я думаю, мне нужно передать tapplyя верю, apply, Я хочу, чтобы эта функция присваивала значение в зависимости от наличия другого значения в другой перемен…
19 июн '18 в 14:22
1 ответ

Работа с сгруппированным набором данных в R

У меня есть набор данных, как: + ---- + ------- + --------- + ---------- + - + | id | время | событие | Timediff | | + ---- + ------- + --------- + ---------- + - + | 1 | 15.00 | установить | - | | | 1 | 15.30 | продажа | 00.30 | | | 1 | 16.00 | про…
03 ноя '15 в 14:15
1 ответ

Слияние и добавление строк в рамках данных в R

Я прочитал многие темы и не думаю, что мой вопрос задавался раньше. у меня есть data.frame в R, связанные с рекламными объявлениями, показанными клиентам как таковые:.. У меня много клиентов, 8 различных продуктов.. так что это всего лишь образец my…
29 мар '14 в 23:24
1 ответ

Группировка всего набора данных и агрегирование

У меня есть набор данных из 20 переменных V1,V2,V3......V20 с 1200 рядами. Я хочу усреднить каждые четыре строки в моем фрейме данных, т.е. мой выходной набор данных должен иметь 20 столбцов, содержащих V1,V2,V3…V20 и 300 строк, содержащих среднее з…
19 сен '14 в 08:51
1 ответ

tapply(дата $ lagged Date`, INDEX = дата dat$Location, FUN = diff(дата $`lagged Date`))

Может кто-нибудь объяснить мне, почему это не работает? tapply(dat$`lagged Date`, INDEX = dat$Location, FUN = diff(dat$`lagged Date`)) Я получаю следующую ошибку: Ошибка в match.fun (FUN): 'diff (dat $)lagged Date) 'не является функцией, символом ил…
23 май '17 в 10:34
3 ответа

Вырезать переменную по-другому на основе другой группирующей переменной

Пример: у меня есть набор данных по высоте по полу. Я хотел бы разделить высоты на низкие и высокие, где точки разреза определяются как среднее значение - 2sd для каждого пола. пример набора данных: set.seed(8) df = data.frame(sex = c(rep("M",100), …
15 сен '16 в 15:42
3 ответа

Суммировать несколько столбцов по группам с помощью tapply

Я хотел суммировать отдельные столбцы по группам, и моей первой мыслью было использовать tapply, Тем не менее, я не могу получить tapply работать. Можно tapply быть использованы для суммирования нескольких столбцов? Если нет, то почему нет? Я много …
27 июл '13 в 22:45
2 ответа

Выполнить функцию по группам

В настоящее время я работаю над удалением выбросов и использую функцию Клодиана Дханы на тему выбросов ( https://datascienceplus.com/identify-describe-plot-and-removing-the-outliers-from-the-dataset/). Мой набор данных состоит из 95000 наблюдений, р…
01 ноя '17 в 00:02
1 ответ

В чем разница между функциями tapply и ave?

Я не могу сосредоточиться на ave функция. Я прочитал помощь и искал в сети, но я все еще не могу понять, что он делает. Я понимаю, что некоторые функции применяются к подмножеству наблюдений, но не так, как, например, tapply Может ли кто-нибудь, пож…
09 мар '14 в 22:47
1 ответ

Сводная статистика ошибок и ошибок для некоторых факторов

Я попытался найти объяснение сводных результатов при использовании с tapply. В следующем примере сводная статистика неверна для фактора "Reg2". Может ли кто-нибудь помочь нам понять это поведение? > edf=data.frame(pri=c(8258, 14253, 11123, 11311)…
23 фев '14 в 01:46
1 ответ

Каков наилучший способ суммировать распределение данных на основе категориальной переменной? Я пытаюсь смоделировать звонки в зависимости от дня недели

У меня есть датафрейм, который содержит дату, день недели (по категориям) и количество вызовов (числовые). Я пытаюсь сделать аналитику о том, как распределяется объем звонков по дням недели. Используя пакет решетки, я смог создать гистограмму, но мн…
02 фев '15 в 20:09
0 ответов

Как использовать tapply в цикле в R

Это может выглядеть как простой вопрос, и это, вероятно, так. У меня есть набор данных с 43 видами и 24 переменными среды, для которых я хотел бы рассчитать среднее значение +/- 95% для каждой переменной среды для каждого вида. Я выяснил, как рассчи…
29 июн '18 в 14:52
1 ответ

R - Разделить один вектор на два отдельных вектора по условию (пациент / контрольный пациент)

Я очень плохо знаком с R и работаю с ЭЭГ, полученными от спящих пациентов. Теперь у меня есть таблица, похожая на эту: ID C3-M2 C4-M1 Disorder 12 347 325 Control 13 397 346 Bipolar 14 368 363 Control 15 370 379 Control 16 368 310 Bipolar Поскольку м…
07 ноя '17 в 16:52
3 ответа

Среднее нескольких чисел в R

Скажем, я генерирую данные с помощью этого кода month<-c(rep(1,7),rep(2,7),rep(3,7)) date<-rep(c(rep(1,2),rep(2,3),rep(3,2)),3) value<-rnorm(21) df<-cbind(month,date,value)) так что теперь у меня есть что-то вроде этого month date value …
15 апр '14 в 19:33
3 ответа

Чтобы передать номер строки в другой столбец

У меня есть датафрейм. Мне нужно найти минимальное значение в 1-м столбце для каждого значения 2-го столбца. Но я должен вернуть значение в 3-м столбце из той же строки, что и минимум, найденный в 1-м столбце. Первая часть кажется решена tapply(1,2,…
30 сен '14 в 00:44
1 ответ

Использование tapply с FUN = function(x){}

В моей задаче я хочу найти среднее значение температуры по полу. Мы можем сделать это с помощью команды tapply. Также я не могу использовать среднюю команду: tapply(df$temperature,df$gender,FUN = function(x){sum(x)/length(df[,1])}) но это дает мне н…
26 апр '16 в 11:21
2 ответа

Сортировка строк в матрице по r

У меня есть простая матрица в r, созданная с помощью tapply: > test_fixer H01 H02 H03 M01 M02 M03 M04 M05 M06 N 0.2205882 0.0750000 0.4027778 0.2926829 0.3207547 0.3142857 0.1627907 0.2653061 0.2285714 Y 0.3181818 0.2222222 0.2280702 0.3278689 0.…
24 сен '15 в 19:26
3 ответа

Функция R, которая.макс с tapply

Я пытаюсь сделать кадр данных с максимальным перезаписью по фактору. Я хотел бы кадр данных с 4 строками (по одной для каждого G) с максимумом для X в этой группе и соответствующим значением Y. Я знаю, что мог бы написать цикл, но не хотел бы. Data&…
18 май '15 в 02:01
1 ответ

R tapply Разница во времени - Единицы несовместимы

Я искал и не смог найти эту проблему на SO, извините, если я пропустил сообщение. Воспроизводимый код, чтобы вы могли, по крайней мере, увидеть, с чем я работаю, но ошибка не воспроизводится (происходит с перебоями в моих данных): require(dplyr) df …
12 май '18 в 23:15