Как мне использовать {target}, когда у меня есть несколько файлов данных

Question

Как мне использовать {target}, когда у меня есть несколько файлов данных

У меня есть ~50 файлов данных (субъектов), которые я обрабатываю индивидуально, прежде чем объединить их в data.frame для моделирования. Я не знаю, как лучше всего использовать для этого {target}.

Я пробовал использовать динамическое ветвление, но не знаю, как при таком подходе отслеживать идентификаторы субъектов. В моем текущем подходе у меня есть все данные в именованном списке, где имена первого уровня являются идентификаторами субъектов, но с целями имена произвольны.

Я знаю, что это не совсем конкретные вопросы, но я надеюсь, что меня укажут на подходящее решение вместо того, чтобы получить «правильный» ответ на неправильный вопрос.

4

r targets-r-package

Источник

user1498656 20 окт '21 в 23:19

1 ответ

Другие вопросы по тегам r targets-r-package

user7199966 20 окт '21 в 23:57 2021-10-20 23:57 · Answer 1 · 2021-10-20 23:57

Это шаблон, который я обычно использую

        tar_files(
    file_paths,
    "file_paths_folder" %>%
      list.files(full.names = TRUE)
  ),
  tar_target(
    processed_files,
    file_paths%>%
      readxl::read_excel() %>% # can be anything read csv, parquet etc.
      janitor::clean_names() %>% # start processing
      mutate_at(vars(a,b,c), as.Date, format = "%Y-%m-%d"), # can be really complex operations
    pattern = map(file_paths)
  )