Распознавание именованных объектов NLTK с использованием корпуса Treebank
Я использую nltk для распознавания именованных сущностей. Функция ne_chunk по умолчанию использует ACE Corpus для разбиения на фрагменты и именованного объекта.
chunked = ne_chunk (pos_tag (word_tokenize (text)))
Я хотел бы знать, есть ли способ использовать другой помеченный корпус, такой как корпус Treebank, для выполнения именованного объекта? Я знаю, что корпус дерева может быть импортирован
из nltk.corpus import treebank
Есть ли способ использовать этот корпус при поиске именованных объектов с помощью функции ne_chunk?