Импорт листов из файлов Excel, расположенных в другой папке в R

В основном у меня есть два файла Excel с одним и тем же именем "Контрольный список" в двух разных папках (один 2018, а другой 2019). Контрольный список содержит разные листы, по одному на каждый месяц: "Январь", "Февраль" и т. Д. Конечно, все листы имеют одинаковые переменные. Я хотел бы поместить в один фрейм данных все листы из обоих файлов Excel. Сейчас я могу собрать листы из одного файла Excel с помощью:

library(readxl)   
library(tibble)
read_excel_allsheets <- function(filename, tibble = TRUE) {
  sheets <- readxl::excel_sheets(filename)
  x <- lapply(sheets, function(X) readxl::read_excel(filename, sheet = X))
  if(!tibble) x <- lapply(x, as.data.frame)
  names(x) <- sheets
  x
}

mysheets <-read_excel_allsheets("C:/Users/Thiphaine/Documents/2018/Checklist.xlsx")
library(dplyr)
mysheets<-bind_rows(mysheets, .id = "column_label")

Я просто не знаю, как создать цикл, который будет проходить через папки 2018 и 2019, чтобы собрать все листы из обоих файлов Excel. Идея также будет состоять в том, что в 2020 году у меня будет еще одна папка "2020", которая должна быть включена... Есть идеи? Спасибо

2 ответа

Решение

Попробуй это:

library(dplyr)
allsheets <- list()
for(file in list.files(path = "PATH/TO/DCUMENTS/", 
    recursive = TRUE, pattern = "*.xlsx", full.names = TRUE)) {
  mysheets <- read_excel_allsheets(file)
  mysheets <- bind_rows(mysheets, .id = "column_label") 
  allsheets[[file]] <- mysheets
}

где PATH/TO/DOCUMENTS вероятно что-то вроде "C:/Users/Thiphaine/Documents/ для тебя.

Если вы хотите, можете также векторизовать его, используя tidyverse подход. Тем более, что все ваши файлы одинаковы (имена столбцов), и вы хотите получить data.frame,

require(tidyverse)

df <- list.files(path = "your_path",
                       full.names = TRUE,
                       recursive = TRUE,
                       pattern = "*.xls") %>% 
tbl_df() %>%
mutate(sheetName = map(value, readxl::excel_sheets)) %>%
unnest(sheetName) %>% 
mutate(myFiles = purrr::map2(value, sheetName, function(x,y) {
    readxl::read_excel(x, sheet = paste(y))})) %>% 
unnest(myFiles)
Другие вопросы по тегам