Как я могу использовать flair NER tagger с DKpro-core

В DKpro уже есть много тегеров, таких как Stanford,opennlp и т. Д., Но я хотел бы знать, как я могу реализовать flair NER tagger в DKpro-core?

2 ответа

Решение

Существующие интегрированные тегеры ядра DKPro, такие как Stanford, OpenNLP и т. Д., Основаны на Java или совместимы с Java. Тем не менее, чутье модели тегов NER разрабатываются на Python. Поэтому для их соединения с ядром DKPro требуется промежуточный инструмент.

DKPro Cassis, библиотека обработки UIMA CAS, написана на Python (также доступна как проект pypi) и может напрямую использовать компоненты чутья, такие как теггер NER flair.

DKPro Cassis может импортировать объекты Cas, сгенерированные основными компонентами DKPro, и аннотировать SofA тегами, предоставленными flairner. После аннотации объект Cas можно экспортировать обратно в ядро ​​DKPro.

PoC находится в стадии разработки для вышеуказанного анализа и скоро будет обновлена ​​здесь.

PoC для интеграции FlairNLP с DKPro делается здесь.

Как уже упоминалось, объекты CAS, созданные DKPro, были импортированы с помощью DKPro cassis. Строка SoFA была аннотирована FlairNLP. Аннотации NER были сопоставлены в соответствии с аннотациями DKPro NER. CAS был записан обратно в файл xmi, который DKPro может прочитать для дальнейшего аннотирования.

Другие вопросы по тегам