Набор данных НЛП dbpedia, используемый для извлечения именованных объектов
Я просмотрел их файлы на github, а также на официальном сайте. Я не могу найти учебный корпус с тегами именованных сущностей, которые они использовали в splotlight.
Как я могу найти набор данных вместо обученной модели?
1 ответ
См. эту ссылку https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Web-service
Здесь описан способ настройки поиска в dbpedia в автономном режиме. Также они дали 4 tar-файла, которые
- redirects_en.nt
- short_abstracts_en.nt
- instance_types_en.nt
- article_categories_en.nt
это должны быть тренировочные данные для него.