Цикл для вычисления среднего значения подмножества фрейма данных в r

Question

Цикл для вычисления среднего значения подмножества фрейма данных в r

У меня есть следующие data.frame:

Я хотел бы написать цикл for, который будет вычислять среднее значение вектора b для каждого значения в векторе a. Поэтому я хотел бы следующий вывод:

> average
    1   2   8
[1] 4.5 7.0 9.0

Моя попытка до сих пор

subset<-data.frame()
average<-vector(mode="numeric")
for (i in 1:length(test$a)) {
  subset<-subset(test,test$a==test$a[i])
  average[i]<-mean(subset$b)
}

Тем не менее, я получаю следующий результат

> average
[1] 4.5 4.5 7.0 7.0 7.0 9.0

Это должно быть довольно легко, но я, к сожалению, не справляюсь.

Не могли бы вы помочь мне?

Заранее большое спасибо.

1

r dataframe loops subset mean

Источник

user5285769 29 июл '17 в 13:53

2 ответа

Решение

Вы можете попробовать это с data.table

library(data.table)
setDT(test)
test[, mean (b), by = a]
a  V1
1: 1 4.5
2: 2 7.0
3: 8 9.0

1

Источник

user3285115 29 июл '17 в 13:59

Другие вопросы по тегам r dataframe loops subset mean

user7727429 29 июл '17 в 14:07 2017-07-29 14:07 · Accepted Answer · 2017-07-29 14:07

Одна строка в базе R...

tapply(test$b,test$a,mean)

  1   2   8 
4.5 7.0 9.0

Кстати, ваш код не работает, потому что вы перебираете каждый элемент test$a, даже дублированные значения, а не только над элементами unique(test$a),

1

Источник

user7727429 29 июл '17 в 14:07