Data Science Cookie Cutter: Как сохранить несколько версий необработанных файлов
Как использовать куки для науки о данных, как сохранить несколько версий необработанных файлов?
Точнее, если у меня есть два файла
data/raw/scrape_2017_06.json
data/raw/scrape_2017_04.json
Как я могу заверить это make
всегда использует новейшую версию?
1 ответ
Решение
Пока вы можете передавать имена файлов и сортировать эти файлы в raw/data
по именам в лексическом порядке эквивалентно сортировке их по возрасту, будет достаточно следующего решения:
DATAFILE:=$(lastword $(sort $(wildcard data/raw/*.json)))
all:
@echo The latest datafile is $(DATAFILE)
Если нет, вам нужно полагаться на команды операционной системы. Для системы Unix многие реализации (конечно, GNU) поддерживают -t для сортировки по времени модификации. Так было бы:
DATAFILE:=$(firstword $(shell ls -t data/raw/*.json))