Как я могу использовать flair NER tagger с DKpro-core
В DKpro уже есть много тегеров, таких как Stanford,opennlp и т. Д., Но я хотел бы знать, как я могу реализовать flair NER tagger в DKpro-core?
2 ответа
Существующие интегрированные тегеры ядра DKPro, такие как Stanford, OpenNLP и т. Д., Основаны на Java или совместимы с Java. Тем не менее, чутье модели тегов NER разрабатываются на Python. Поэтому для их соединения с ядром DKPro требуется промежуточный инструмент.
DKPro Cassis, библиотека обработки UIMA CAS, написана на Python (также доступна как проект pypi) и может напрямую использовать компоненты чутья, такие как теггер NER flair.
DKPro Cassis может импортировать объекты Cas, сгенерированные основными компонентами DKPro, и аннотировать SofA тегами, предоставленными flairner. После аннотации объект Cas можно экспортировать обратно в ядро DKPro.
PoC находится в стадии разработки для вышеуказанного анализа и скоро будет обновлена здесь.
PoC для интеграции FlairNLP с DKPro делается здесь.
Как уже упоминалось, объекты CAS, созданные DKPro, были импортированы с помощью DKPro cassis. Строка SoFA была аннотирована FlairNLP. Аннотации NER были сопоставлены в соответствии с аннотациями DKPro NER. CAS был записан обратно в файл xmi, который DKPro может прочитать для дальнейшего аннотирования.