Как реализовать декодер поиска луча в конечной точке хостинга SageMaker?

Я создал модель SageMaker для нейронной сети Seq2Seq, а затем запустил конечную точку SageMaker:

create_endpoint_config_response = sage.create_endpoint_config(
    EndpointConfigName = endpoint_config_name,
    ProductionVariants=[{
        'InstanceType':'ml.m4.xlarge', 
        'InitialInstanceCount':1,
        'ModelName':model_name,
        'VariantName':'AllTraffic'}])

create_endpoint_response = sage.create_endpoint(
    EndpointName=endpoint_name,
    EndpointConfigName=endpoint_config_name)

Эта стандартная конечная точка не поддерживает поиск луча. Каков наилучший подход для создания конечной точки SageMaker, поддерживающей поиск луча?

1 ответ

Исходя из вашего комментария, я считаю, что единственное решение - создать собственный докер-контейнер для вывода. Таким образом, вы можете загрузить свою уже обученную модель и делать с ней что угодно. Этот пример - хорошее место для начала, когда вы хотите узнать, как использовать docker в sagemaker.

Для вашего случая использования было бы лучше найти исходный код для встроенной модели seq2seq sagemaker (встроенные алгоритмы также являются просто образами докеров), изменить его в соответствии с вашими потребностями, скомпоновать модифицированный контейнер докеров и загрузить его в свой aws ecr, из где вы можете загрузить его с Sagemaker.

К сожалению, я не знаю, является ли исходный код Docker-контейнеров общедоступным (не нашел его с первой попытки).

Другие вопросы по тегам