Применить функцию на разных уровнях
У меня есть следующий кусок:
library(tidyverse)
set.seed(1234)
df <- tibble(
x1 = letters[1:2],
y1 = list(
tibble(
x2 = letters[3:4],
y2 = list(
tibble(
x3 = seq(1, 100, 1),
y3 = rnorm(100)
)
)
)
)
)
И мне нужно получить доступ к тибблу внутри тиббла, который содержит x3
а также y3
и применить пользовательскую функцию к каждому фрейму данных. Для простоты, скажем, мне нужно применить base::mean()
в y3
,
Мои реальные данные намного больше, чем это, поэтому я ищу чистый и эффективный способ сделать это. Есть идеи?
2 ответа
Решение
Не могли бы вы просто спуститься вниз?
df %>% unnest() %>% unnest() %>%
group_by(x2) %>%
summarise(mean(y3))
# A tibble: 2 x 2
x2 `mean(y3)`
<chr> <dbl>
1 c -0.157
2 d -0.157
Не уверен, как вы хотите, чтобы ваш окончательный фрейм данных выглядел, но вот еще одно предложение
df %>% unnest() %>%
mutate(y3.average = map(y2, ~mean(.$y3)) ) %>%
unnest(y3.average)
# A tibble: 4 x 4
x1 x2 y2 y3.average
<chr> <chr> <list> <dbl>
1 a c <tibble [100 × 2]> -0.157
2 a d <tibble [100 × 2]> -0.157
3 b c <tibble [100 × 2]> -0.157
4 b d <tibble [100 × 2]> -0.157
Вам нужно найти уровень, на котором вы хотите применить функцию (что я делаю с помощью индексации в скобках), а затем применить функцию. Я надеюсь, что это переносится на то, что вам нужно сделать.
> df[["y1"]][[1]][[2]] %>% lapply(., function(x){mean(x$y3)})
[[1]]
[1] 0.04124318
[[2]]
[1] 0.04124318