Газеты со Стэнфордом NER
Я делаю свою собственную модель Stanford NER, основанную на CRF, следуя соглашениям, приведенным по этой ссылке.
Я хочу добавить Бюллетени и следуя этому по той же ссылке. Я упоминаю все мои газеты, используя это свойство, gazette=file1.txt;file2.txt, а также упоминаю useGazettes=true в austen.prop.
После создания модели, когда я тестирую данные из моих Бюллетеней, она неправильно помечается. Тег, о котором я упоминал в файлах, не подходит правильно. Для меня это несколько удивительные результаты, поскольку Stanford NER не дает им тот же тег, который упоминался в этих файлах.
Есть ли какие-то ограничения в Stanford NER для Gazets или я все еще что-то упускаю? Если кто-то может мне помочь, я буду вам благодарен.