Описание тега datalad
DataLad — это программное обеспечение для совместного управления кодом, данными и их взаимосвязями. Он построен на основе универсальной системы логистики данных (git-annex) и популярной распределенной системы контроля версий (Git). DataLad адаптирует принципы разработки и распространения программного обеспечения с открытым исходным кодом для решения технических проблем управления данными, совместного использования данных и сбора цифрового происхождения на протяжении всего жизненного цикла цифровых объектов. Это помогает упростить процедуры потребления, публикации и обновления данных любого размера и типа, а также связать их как точно версионные и облегченные зависимости.
DataLad предлагает Python и API командной строки. Он реализует расширяемую архитектуру, которая не зависит от каких-либо централизованных сервисов, но облегчает взаимодействие с множеством существующих инструментов и сервисов. Существуют различные пакеты расширений , которые расширяют область действия основного пакета (например, выполнение на основе контейнера и сбор данных о происхождении, графический интерфейс пользователя или рабочие процессы метаданных).
Домашняя страница проекта: https://datalad.org .
Более подробная информация доступна в
- DataLad Handbook, основная пользовательская документация DataLad.
- вводный документ
- иллюстрация варианта использования децентрализованного управления данными
- подробное описание воспроизводимых (рабочих процессов HPC)
- YouTube-канал DataLad с множеством демонстраций и докладов