Как мне использовать {target}, когда у меня есть несколько файлов данных

У меня есть ~50 файлов данных (субъектов), которые я обрабатываю индивидуально, прежде чем объединить их в data.frame для моделирования. Я не знаю, как лучше всего использовать для этого {target}.

Я пробовал использовать динамическое ветвление, но не знаю, как при таком подходе отслеживать идентификаторы субъектов. В моем текущем подходе у меня есть все данные в именованном списке, где имена первого уровня являются идентификаторами субъектов, но с целями имена произвольны.

Я знаю, что это не совсем конкретные вопросы, но я надеюсь, что меня укажут на подходящее решение вместо того, чтобы получить «правильный» ответ на неправильный вопрос.

1 ответ

Это шаблон, который я обычно использую

        tar_files(
    file_paths,
    "file_paths_folder" %>%
      list.files(full.names = TRUE)
  ),
  tar_target(
    processed_files,
    file_paths%>%
      readxl::read_excel() %>% # can be anything read csv, parquet etc.
      janitor::clean_names() %>% # start processing
      mutate_at(vars(a,b,c), as.Date, format = "%Y-%m-%d"), # can be really complex operations
    pattern = map(file_paths)
  )
Другие вопросы по тегам