Есть ли какие-либо преимущества в использовании кластера Dask с вычислением на GPU по сравнению с кластером Dask с вычислением на процессоре для skorch/scikeras?
Мы развернули Dask Gateway для наших пользователей и хотим побудить их использовать Dask в своих рабочих процессах машинного обучения специально для создания моделей глубокого обучения. Текущая установка в рабочей среде использует вычислительные кластеры Dask Clusters. Я так понимаю Dask-ML совместим с Keras и PyTorch через scikeras и skorch соответственно. Нужно ли нам обновлять развертывание Dask Gateway для поддержки графических процессоров или текущей настройки достаточно для наших пользователей? В частности, для распределенного обучения, добавочного обучения, оптимизации гиперпараметров и распараллеленных прогнозов дают ли работники dask-cuda какие-либо существенные преимущества по сравнению со стандартными работниками dask?