Точное словарное распознавание именованных сущностей в Стэнфорде

Question

Точное словарное распознавание именованных сущностей в Стэнфорде

У меня есть словарь именованных сущностей, извлеченный из Википедии. Я хочу использовать его как словарь NER. Я хотел знать, как я могу использовать Stanford-NER с этими моими данными. Я также скачал Lingpipe, хотя понятия не имею, как я могу его использовать. Буду признателен за все виды информации.

Спасибо за вашу помощь.

3

java stanford-nlp named-entity-recognition named-entity-extraction lingpipe

Источник

user6333421 11 июн '16 в 11:54

3 ответа

Решение

Вы можете использовать MER: http://labs.fc.ul.pt/mer/

минимальный распознаватель сущностей, разработанный в bash: https://github.com/lasigeBioTM/MER

в качестве входных данных требуется только лексикон (текстовый файл)

1

Источник

user8339995 21 сен '17 в 11:11

Stanford-NER основан на CRF, которые являются статистической моделью. Боюсь, он не поддерживает дополнительный словарь или лексику. Тем не менее, вы можете обучить новую модель в соответствии со своими задачами.

1

Источник

user1837553 25 авг '16 в 02:00

Другие вопросы по тегам java stanford-nlp named-entity-recognition named-entity-extraction lingpipe

user235019 17 сен '16 в 17:25 2016-09-17 17:25 · Accepted Answer · 2016-09-17 17:25

Вы можете использовать словарь (или основанное на регулярном выражении) именованное распознавание сущностей с Stanford CoreNLP. Смотрите аннотатор RegexNER. Для некоторых приложений мы запускаем это с довольно большими словарями сущностей. Тем не менее, для нас это, как правило, вторичный инструмент для использования статистических (на основе CRF) NER.