ошибка предварительно обученного атрибута извлечения отношения Роберты

Я пытаюсь заставить работать следующую предварительно обученную модель huggingface: https://huggingface.co/mmoradi/Robust-Biomed-RoBERTa-RelationClassification

Я использую следующий код:

      from transformers import AutoTokenizer, AutoModel
  
tokenizer = AutoTokenizer.from_pretrained("mmoradi/Robust-Biomed-RoBERTa-RelationClassification")

model = AutoModel.from_pretrained("mmoradi/Robust-Biomed-RoBERTa-RelationClassification")

inputs = tokenizer("""The colorectal cancer was caused by mutations in angina""")
outputs = model(**inputs)

По какой-то причине я получаю следующую ошибку при попытке создать выходные данные, поэтому в последней строке моего кода:

-> 796 input_shape = input_ids.size () 797 elif inputs_embeds не равно None: 798 input_shape = inputs_embeds.size () [: - 1]

AttributeError: объект 'list' не имеет атрибута 'size'

Входы выглядят так:

      {'input_ids': [0, 133, 11311, 1688, 3894, 337, 1668, 21, 1726, 30, 28513, 11, 1480, 347, 2], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

Я понятия не имею, как отладить это, поэтому любая помощь или подсказки приветствуются!

1 ответ

Решение

Вы должны указать тип тензора, который вы хотите взамен tokenizer. Если вы этого не сделаете, он вернет словарь с двумя списками ( input_ids а также attention_mask):

      inputs = tokenizer("""The colorectal cancer was caused by mutations in angina""", return_tensors="pt")
Другие вопросы по тегам