Корпус с семантическими ролевыми тегами для приложения НЛП
Итак, я сконструировал программу NLP, которая учится извлекать описание семантического события из предложения, но сейчас мой тренировочный набор ограничен предложениями, которые я проанализировал в компонентах семантического события моей руки.
Хотя этот метод выполняет свою работу, его вряд ли можно заменить большим предварительно проанализированным корпусом текста. К сожалению, все мои попытки найти такой корпус оказались тщетными.
Что мне конкретно нужно, так это корпус, который помечал семантические роли каждого слова (или группы слов) в предложении. Примерами ролей, которые я имел в виду, являются такие вещи, как:
- агент
- действие
- пациент
- инструмент
- сопутствующий агент
- сотрудничество пациента
- место нахождения
- наречие
Если вам нужны какие-то дополнительные подробности, не стесняйтесь спрашивать или обращаться к этой статье, в которой используется игрушечный корпус с теми же ограничениями, что и у меня.
1 ответ
Совместной задачей CoNLL в 2005 году было "семантическое обозначение ролей". Эта страница описывает их корпус и какие роли они помечены.