Ошибка при загрузке квантованной модели BERT из локального репозитория

После квантования модели BERT она работает без проблем. Но если я сохраню квантованную модель и загружу, она не сработает. Отображается сообщение об ошибке: объект LinearPackedParams не имеет атрибута _modules. Я использовал то же устройство для сохранения и загрузки квантованной модели.

      model = SentenceTransformer('bert-base-nli-mean-tokens')
model.encode(sentences)
quantized_model = torch.quantization.quantize_dynamic(
                model, {torch.nn.Linear}, dtype=torch.qint8)
quantized_model.encode(sentences) ```



torch.save(quantized_model, 
       "/PATH/TO/DESTINATION/Base_bert_quant.pt")
model=torch.load("/SAME/PATH/Base_bert_quant.pt")
model.encode(sentences) #shows the error

0 ответов

Другие вопросы по тегам