Как я могу полностью использовать главный процессор на платформе AI Google Cloud
Сегодня я отправил программу, написанную с использованием TensorFlow, на платформу Google AI. При локальном запуске я использовал top в терминале, чтобы увидеть использование ЦП - и оно варьировалось от 400 до 600%. Однако, когда я запускаю программу на платформе AI Google, используя следующий код:
gcloud ai-platform jobs submit training $JOB_NAME \
--job-dir $OUTPUT_PATH \
--runtime-version 1.13 \
--python-version 3.5 \
--package-path source/ \
--module-name source.train \
--region $REGION \
--scale-tier CUSTOM \
--master-machine-type n1-standard-8 \
-- \
... my training params
Когда я отслеживаю его прогресс на панели управления Google Cloud, я вижу, что загрузка основного ЦП колеблется в пределах 15-20%, что говорит мне о том, что фактически используется только один из 8 виртуальных ЦП. Я исследовал изменение intra_op_parallelism_threads и inter_op_parallelism_threads в моей конфигурации в TF (как предлагается здесь), но мне вообще не удалось улучшить использование ЦП.