Распознавание нескольких объектов с ошибкой Spacy python

Я застрял в проблеме и ищу у вас помощь. Я пытаюсь обучить несколько объектов, используя простор

Ниже приведены данные моего поезда

response =[
('java developer with java and html css javascript ',
{'entities': [(0, 14, 'jobtitle'),
(0 , 4, 'skills'),
(34,37,'skills'),
(38, 49, 'skills')
]
}),
('looking for software engineer with java python',
{
'entities': [
(12, 29, 'jobtitle'),
(40, 46, 'skills'),
(35,39,"skills")
]
})
]

вот код поезда, у меня проблема

        nlp = spacy.blank("en")
        optimizer = nlp.begin_training()
        for i in range(20):
            random.shuffle(TRAIN_DATA)
            for text, annotations in TRAIN_DATA:
                nlp.update([text], [annotations], sgd=optimizer)

Ошибка: ValueError: [E103] Попытка установить конфликтующие документы: '(0, 14, 'jobtitle')' и '(0, 4, 'skills')'. Токен может быть частью только одного объекта, поэтому убедитесь, что объекты, которые вы устанавливаете, не перекрываются.

1 ответ

Как объясняется в сообщении об ошибке, модель NER spacy не поддерживает перекрывающиеся диапазоны сущностей, поэтому вы не можете обучить модель с помощью этих аннотаций.

Другие вопросы по тегам