Data Science Cookie Cutter: Как сохранить несколько версий необработанных файлов

Как использовать куки для науки о данных, как сохранить несколько версий необработанных файлов?

Точнее, если у меня есть два файла

data/raw/scrape_2017_06.json
data/raw/scrape_2017_04.json

Как я могу заверить это make всегда использует новейшую версию?

1 ответ

Решение

Пока вы можете передавать имена файлов и сортировать эти файлы в raw/data по именам в лексическом порядке эквивалентно сортировке их по возрасту, будет достаточно следующего решения:

DATAFILE:=$(lastword $(sort $(wildcard data/raw/*.json)))

all:
    @echo The latest datafile is $(DATAFILE)

Если нет, вам нужно полагаться на команды операционной системы. Для системы Unix многие реализации (конечно, GNU) поддерживают -t для сортировки по времени модификации. Так было бы:

DATAFILE:=$(firstword $(shell ls -t data/raw/*.json))
Другие вопросы по тегам