Как мне использовать {target}, когда у меня есть несколько файлов данных
У меня есть ~50 файлов данных (субъектов), которые я обрабатываю индивидуально, прежде чем объединить их в data.frame для моделирования. Я не знаю, как лучше всего использовать для этого {target}.
Я пробовал использовать динамическое ветвление, но не знаю, как при таком подходе отслеживать идентификаторы субъектов. В моем текущем подходе у меня есть все данные в именованном списке, где имена первого уровня являются идентификаторами субъектов, но с целями имена произвольны.
Я знаю, что это не совсем конкретные вопросы, но я надеюсь, что меня укажут на подходящее решение вместо того, чтобы получить «правильный» ответ на неправильный вопрос.
1 ответ
Это шаблон, который я обычно использую
tar_files(
file_paths,
"file_paths_folder" %>%
list.files(full.names = TRUE)
),
tar_target(
processed_files,
file_paths%>%
readxl::read_excel() %>% # can be anything read csv, parquet etc.
janitor::clean_names() %>% # start processing
mutate_at(vars(a,b,c), as.Date, format = "%Y-%m-%d"), # can be really complex operations
pattern = map(file_paths)
)