Как использовать fill_by_function() с na.approx() [линейная интерполяция] внутри dplyr
Я просматриваю документацию для падра:
https://cran.r-project.org/web/packages/padr/vignettes/padr.html
,
Немного изменив пример виньетки, чтобы использовать линейную интерполяцию (zoo::na.approx()
) на данных выдает ошибку:
library(tidyverse)
library(padr)
library(zoo)
set.seed(123)
emergency %>%
filter(title == 'EMS: DEHYDRATION') %>%
thicken(interval = 'day') %>%
group_by(time_stamp_day) %>%
summarise(nr = n() + as.integer(runif(1, 1, 999)) ) %>%
pad()
результаты в:
# A tibble: 307 × 2
time_stamp_day nr
<date> <int>
1 2015-12-12 79
2 2015-12-13 42
3 2015-12-14 NA
4 2015-12-15 NA
5 2015-12-16 NA
6 2015-12-17 NA
7 2015-12-18 88
8 2015-12-19 NA
9 2015-12-20 NA
10 2015-12-21 NA
# ... with 297 more rows
Теперь я хочу интерполировать от 42 до 88 линейно. Я думал, что лучший способ достичь этого будет использовать zoo::na.approx()
внутри padr::fill_by_function()
:
emergency %>%
filter(title == 'EMS: DEHYDRATION') %>%
thicken(interval = 'day') %>%
group_by(time_stamp_day) %>%
summarise(nr = n() + as.integer(runif(1, 1, 99)) ) %>%
pad() %>%
fill_by_function(nr, na.approx)
Но я получаю следующую ошибку:
Error in inds[i] <- which(colnames_x == as.character(cols[[i]])) :
replacement has length zero
Любые идеи о том, как начать это исправить?
1 ответ
Решение
Вам нужно только mutate
сделать na.approx
:
library(tibble);library(zoo)
emergency <- as_tibble(read.table(text="time_stamp_day nr
1 2015-12-12 79
2 2015-12-13 42
3 2015-12-14 NA
4 2015-12-15 NA
5 2015-12-16 NA
6 2015-12-17 NA
7 2015-12-18 88
8 2015-12-19 NA
9 2015-12-20 NA
10 2015-12-21 NA",header=TRUE,stringsAsFactors=FALSE))
emergency %>% mutate(nr=na.approx(nr,na.rm =FALSE))
# A tibble: 10 × 2
time_stamp_day nr
<chr> <dbl>
1 2015-12-12 79.0
2 2015-12-13 42.0
3 2015-12-14 51.2
4 2015-12-15 60.4
5 2015-12-16 69.6
6 2015-12-17 78.8
7 2015-12-18 88.0
8 2015-12-19 NA
9 2015-12-20 NA
10 2015-12-21 NA