Описание тега horovod

0 ответов

Нет модуля с именем horovod

я уже использовалpip install horovod в cmd, но пакет не удалось установить. Как с этим бороться, ребята. Пожалуйста помоги. Using cached horovod-0.25.0.tar.gz (3.4 MB) Requirement already satisfied: cloudpickle in c:\users\hp\anaconda3\lib\site-pack…
13 авг '22 в 03:53
0 ответов

Проблема преобразования данных Spark при прогнозировании с помощью Horovod KerasEstimator()

Я обучаю модель Keras созданию рекомендательной системы и запускаю ее в Spark с Хороводом иhvd.KerasEstimator(). Вот мой оценщик: keras_estimator = hvd.KerasEstimator( num_proc=2, store=store, model=model, optimizer=optimizer, loss='mse', metrics=[t…
02 июн '23 в 14:25
0 ответов

Вопрос о запуске MPI и Horovod в ядре Jupyter Python

Я хочу поэкспериментировать с ноутбуком, на котором работает хоровод, распределенный по трем узлам HPC, каждый с одним графическим процессором. Я загружаю эти модули в определение своего ядра: "module load shared slurm jupyter-eg-kernel-wlm-py39 hor…
04 апр '23 в 03:06
0 ответов

NCCL WARN Ошибка Cuda «недопустимая функция устройства» и «неверный порядковый номер устройства»

Среда: Фреймворк: TensorFlow Версия Framework: 2.4.0 Версия Horovod: 0.25.0 Версия MPI: 4.0.0 Версия CUDA: 11.0 Версия NCCL: 2.8.3 Версия Python: 3.6 ОС и версия: Ubuntu 18.04 Версия GCC: 7.5.0 Привет, я использую hovorod и TensorFlow2.4 для проведе…
27 июл '23 в 03:51
0 ответов

Как создать тензорную переменную на главном рабочем с хороводом тензорного потока?

Мне нужна скалярная переменная, чтобы что-то посчитать. В режиме сервера параметров я создал его на первом узле ps, и все рабочие могут запустить его для обновления. Он работает нормально. with tf.device('/job:ps/task:0/cpu:0'): var_for_count = tf.g…
20 мар '23 в 10:22