Изображение-классификация-передача-обучение Sagemaker проблема
Я получаю такую ошибку при попытке классификации изображений с помощью Sagemaker:
ClientError: An error occurred (ValidationException) when calling the CreateTrainingJob operation: 1 validation error detected: Value 'ml.t2.medium' at 'resourceConfig.instanceType' failed to satisfy constraint: Member must satisfy enum value set: [ml.p2.xlarge, ml.m5.4xlarge, ml.m4.16xlarge, ml.p3.16xlarge, ml.m5.large, ml.p2.16xlarge, ml.c4.2xlarge, ml.c5.2xlarge, ml.c4.4xlarge, ml.c5.4xlarge, ml.c4.8xlarge, ml.c5.9xlarge, ml.c5.xlarge, ml.c4.xlarge, ml.c5.18xlarge, ml.p3.2xlarge, ml.m5.xlarge, ml.m4.10xlarge, ml.m5.12xlarge, ml.m4.xlarge, ml.m5.24xlarge, ml.m4.2xlarge, ml.p2.8xlarge, ml.m5.2xlarge, ml.p3.8xlarge, ml.m4.4xlarge]
1 ответ
ml.t2.medium
Тип экземпляра недоступен в SageMaker Training на момент написания этой статьи.
Вы можете обратиться к https://aws.amazon.com/sagemaker/pricing/ чтобы увидеть поддерживаемые типы экземпляров в компоненте и регионе, которые вы используете.
Вы также должны проверить, имеет ли алгоритм, который вы запускаете, дополнительные аппаратные ограничения. Например, документ Image Classification Algorithm вызывает необходимость использования экземпляров GPU для обучения:
Для классификации изображений мы поддерживаем следующие экземпляры GPU для обучения: ml.p2.xlarge, ml.p2.8xlarge, ml.p2.16xlarge, ml.p3.2xlarge, ml.p3.8xlarge и ml.p3.16xlarge. Мы рекомендуем использовать экземпляры GPU с большей памятью для обучения с большими размерами пакетов. Однако для вывода могут использоваться экземпляры как CPU (например, C4), так и GPU (например, P2 и P3). Вы также можете запустить алгоритм на нескольких графических процессорах и на нескольких машинах для распределенного обучения.
Оба экземпляра P2 и P3 поддерживаются в алгоритме классификации изображений.