Корпус с семантическими ролевыми тегами для приложения НЛП

Итак, я сконструировал программу NLP, которая учится извлекать описание семантического события из предложения, но сейчас мой тренировочный набор ограничен предложениями, которые я проанализировал в компонентах семантического события моей руки.

Хотя этот метод выполняет свою работу, его вряд ли можно заменить большим предварительно проанализированным корпусом текста. К сожалению, все мои попытки найти такой корпус оказались тщетными.

Что мне конкретно нужно, так это корпус, который помечал семантические роли каждого слова (или группы слов) в предложении. Примерами ролей, которые я имел в виду, являются такие вещи, как:

  • агент
  • действие
  • пациент
  • инструмент
  • сопутствующий агент
  • сотрудничество пациента
  • место нахождения
  • наречие

Если вам нужны какие-то дополнительные подробности, не стесняйтесь спрашивать или обращаться к этой статье, в которой используется игрушечный корпус с теми же ограничениями, что и у меня.

1 ответ

Решение

Совместной задачей CoNLL в 2005 году было "семантическое обозначение ролей". Эта страница описывает их корпус и какие роли они помечены.

Другие вопросы по тегам