Как перевести синтаксический анализ в дерево разбора зависимостей?

Используя грамматику ссылок, я могу получить синтаксический анализ предложений примерно так:

    +-------------------Xp------------------+
    +------->WV------->+------Ost------+    |
    +-----Wd----+      |  +----Ds**x---+    |
    |     +Ds**c+--Ss--+  +-PHc+---A---+    |
    |     |     |      |  |    |       |    |
LEFT-WALL a  koala.n is.v a cute.a animal.n . 

    +---------------------Xp--------------------+
    +------->WV------>+---------Osm--------+    |
    +-----Wd----+     |  +------Ds**x------+    |
    |     +Ds**c+--Ss-+  +--PHc-+-----A----+    |
    |     |     |     |  |      |          |    |
LEFT-WALL a  wolf.n is.v a dangerous.a animal.n . 

    +--------------------Xp--------------------+
    +------->WV------>+--------Ost--------+    |
    +-----Wd----+     |  +------Ds**x-----+    |
    |     +Ds**c+--Ss-+  +--PHc-+----A----+    |
    |     |     |     |  |      |         |    |
LEFT-WALL a   dog.n is.v a faithful.a animal.n . 

    +-----------------------Xp----------------------+
    +------->WV------->+----------Osm----------+    |
    +-----Wd----+      |   +-------Ds**x-------+    |
    |     +Ds**c+--Ss--+   +--PHv--+-----A-----+    |
    |     |     |      |   |       |           |    |
LEFT-WALL a monkey.n is.v an independant.a animal.n . 

Проблема в том, что AFAIK невозможно определить программно; Похоже, что путь состоит в том, чтобы преобразовать этот синтаксический вывод в дерево разбора зависимостей, как мне этого добиться?

1 ответ

Вы можете посмотреть на RelEx ( на GitHub).

Из грамматики ссылок в Википедии (выделено мое):

Средство извлечения семантических отношений RelEx, расположенное поверх библиотеки грамматики ссылок, генерирует выход грамматики зависимостей, делая явными семантические отношения между словами в предложении. Его выходные данные могут быть классифицированы как находящиеся на уровне между данными SSyntR и DSyntR в теории смысла текста. Он также обеспечивает кадрирование / заземление, разрешение анафоры, идентификацию ключевых слов, лексическое разбиение на фрагменты, идентификацию части речи и тегирование, включая тегирование объекта, даты, денег, пола и т. Д. Он включает в себя режим совместимости для генерации вывода зависимостей, совместимого с анализатором Stanford, и Pn-теги, совместимые с Penn Treebank.

Другие вопросы по тегам