Добавление знаний о домене (пользовательские функции) в NER
Я на машине с Ubuntu с Python 3.5.2 и spaCy 2.0. Я тренирую пустую испанскую модель для распознавания сущностей в резюме. Для этого я использовал пользовательские вложения слов, и я делаю большой проект аннотации сущностей. Мне удалось сегментировать резюме и выяснить, к какому разделу резюме относится сегмент, используя вложение слова, и я хочу использовать эти знания для увеличения NER spaCy (например, если объект принадлежит разделу опыта работы, он с большей вероятностью быть организацией, чем учебным заведением). Я просматривал документацию и, хотя я увидел, что есть способ добавить пользовательские атрибуты и / или рассчитать их с использованием конвейеров и расширений, я не смог сказать, будет ли алгоритм NER использовать их как функции по умолчанию или мне нужно добавить пользовательские код к нему.
Есть ли способ сделать это вручную или это нестандартное поведение?
Спасибо и всего наилучшего.