Гнездо применить функцию в Tapply
Я хотел бы использовать tapply
сгруппировать результат функции по переменной. Функция, которую я думаю, мне нужно передать tapply
я верю, apply
, Я хочу, чтобы эта функция присваивала значение в зависимости от наличия другого значения в другой переменной (var1
), однако, если значение var1
что-то еще в следующем ряду (внутри группировки), то я хотел бы назначить другое значение. Вот то, что я пытался, но это не работает. Я не уверен, что это из-за моего подхода или из-за неправильной функции
#example data
df.examp <- tibble(id = c(rep(1, 4), rep(2, 4), rep(3, 4)),
var1 = c('a','a','b','b','a','a','a','a','b','b','b','b'))
#my attempt
df.examp$var2 <- tapply(df.examp$var1, df.examp$id,
apply(df.examp$var1, 1, function(j)
if (j == 'a'){
'foo'
} else if (j == 'a' & j + 1 == 'b'){
'bar'
} else {
'other'
}
)
)
#hoped for outcome
df.examp <- mutate(df.examp, var2 = c(rep('bar', 4), rep('foo', 4), rep('other', 4)))
У кого-нибудь есть идеи, где это идет не так?
1 ответ
Решение
Мы могли бы case_when
после группировки по id
library(dplyr)
df.examp %>%
group_by(id) %>%
mutate(var2 = case_when(any(var1 == 'a' & lead(var1) == 'b') ~ 'bar',
var1 == 'a' ~ 'foo',
TRUE ~ 'other'))
# A tibble: 12 x 3
# Groups: id [3]
# id var1 var2
# <dbl> <chr> <chr>
# 1 1 a bar
# 2 1 a bar
# 3 1 b bar
# 4 1 b bar
# 5 2 a foo
# 6 2 a foo
# 7 2 a foo
# 8 2 a foo
# 9 3 b other
#10 3 b other
#11 3 b other
#12 3 b other