Описание тега dask
Dask - это библиотека для параллельных вычислений и анализа данных для Python. Он поддерживает динамическое планирование задач, оптимизированное для вычислений, а также для сбора больших данных.
Dask имеет открытый исходный код и находится в свободном доступе. Он разработан в сотрудничестве с другими проектами сообщества, такими как Numpy, Pandas и Scikit-Learn. Он поддерживает динамическое планирование задач, оптимизированное для вычислений, а также для сбора больших данных.
Dask состоит из двух компонентов:
- Динамическое планирование задач, оптимизированное для вычислений. Это похоже на Airflow, Luigi, Celery или Make, но оптимизировано для интерактивных вычислительных рабочих нагрузок.
- Коллекции "больших данных", такие как параллельные массивы, фреймы данных и списки, которые расширяют общие интерфейсы, такие как итераторы NumPy, Pandas или Python, на большие, чем память, или распределенные среды. Эти параллельные коллекции работают поверх динамических планировщиков задач.
Установить: https://docs.dask.org/en/latest/install.html
Документы: https://docs.dask.org/
GitHub: https://github.com/dask/dask-tutorial
Заглавная страница: https://dask.org/