Распознавание именованных объектов NLTK с использованием корпуса Treebank

Я использую nltk для распознавания именованных сущностей. Функция ne_chunk по умолчанию использует ACE Corpus для разбиения на фрагменты и именованного объекта.

chunked = ne_chunk (pos_tag (word_tokenize (text)))

Я хотел бы знать, есть ли способ использовать другой помеченный корпус, такой как корпус Treebank, для выполнения именованного объекта? Я знаю, что корпус дерева может быть импортирован

из nltk.corpus import treebank

Есть ли способ использовать этот корпус при поиске именованных объектов с помощью функции ne_chunk?

0 ответов

Другие вопросы по тегам