Zarr сохранение нескольких файлов в общей файловой системе становится все медленнее, zarr или os проблема?

Я обрабатываю набор изображений в кластере с несколькими узлами. Каждое изображение обрабатывается в отдельном ядре.
Во время обработки выходные данные сохраняются в словаре, который временно сохраняется в zarr.DictStore объект. В конце сценария диктат сохраняется в zarr.DirectoryStore с помощью zarr.copy_store функция.
У меня ~ 200 файлов, и в начале обработки вывод сохраняется быстро, но файлы zarr генерируются медленнее и медленнее (последние файлы ~30 минут каждый).
- Когда я запускаю, обрабатывать одни и те же файлы и сохранять их с помощью hdf5 нет разницы во времени обработки.
- Там не значительная дополнительная io давление на сервере.

Любая идея, если это вопрос ZARR или OS?
Любое предложение о том, как я могу выяснить / решить проблему?

Спасибо

0 ответов

Другие вопросы по тегам