Гнездо применить функцию в Tapply

Я хотел бы использовать tapply сгруппировать результат функции по переменной. Функция, которую я думаю, мне нужно передать tapplyя верю, apply, Я хочу, чтобы эта функция присваивала значение в зависимости от наличия другого значения в другой переменной (var1), однако, если значение var1 что-то еще в следующем ряду (внутри группировки), то я хотел бы назначить другое значение. Вот то, что я пытался, но это не работает. Я не уверен, что это из-за моего подхода или из-за неправильной функции

#example data
df.examp <- tibble(id = c(rep(1, 4), rep(2, 4), rep(3, 4)),
   var1 = c('a','a','b','b','a','a','a','a','b','b','b','b'))

#my attempt
df.examp$var2 <- tapply(df.examp$var1, df.examp$id,
                        apply(df.examp$var1, 1, function(j)
                          if (j == 'a'){
                            'foo'
                          } else if (j == 'a' & j + 1 == 'b'){
                            'bar'
                          } else {
                            'other'
                          }
                        )

)

#hoped for outcome
df.examp <- mutate(df.examp, var2 = c(rep('bar', 4), rep('foo', 4), rep('other', 4)))

У кого-нибудь есть идеи, где это идет не так?

1 ответ

Решение

Мы могли бы case_when после группировки по id

library(dplyr)
df.examp %>% 
  group_by(id) %>%
  mutate(var2 = case_when(any(var1 == 'a' & lead(var1) == 'b') ~ 'bar', 
         var1 == 'a' ~ 'foo', 
         TRUE ~ 'other'))
# A tibble: 12 x 3
# Groups:   id [3]
#      id var1  var2 
#   <dbl> <chr> <chr>
# 1     1 a     bar  
# 2     1 a     bar  
# 3     1 b     bar  
# 4     1 b     bar  
# 5     2 a     foo  
# 6     2 a     foo  
# 7     2 a     foo  
# 8     2 a     foo  
# 9     3 b     other
#10     3 b     other
#11     3 b     other
#12     3 b     other
Другие вопросы по тегам