Грамматическая основа Г.Ф. и Совы

Я заинтересован в области компьютерной лингвистики и НЛП. Я много читал о Grammatic Framework (GF), который делится на абстрактный синтаксис и конкретный синтаксис. И я немного знаю о OWL, RDF и WordNet. Меня смущают различия между двумя технологиями.

  1. Можем ли мы использовать GF, а не OWL в качестве составителей синтаксиса?
  2. Можем ли мы устранить Parser с помощью GF?
  3. Содержит ли GF все термины, поэтому нам не нужно использовать WordNet?

1 ответ

Одним из формальных определений грамматической структуры является:

Grammatic Framework (GF), grammaticframework.org, это многоязычный грамматический формализм, основанный на идее общего абстрактного синтаксиса и отображений между абстрактным синтаксисом и конкретными языками. GF имеет сотни пользователей по всему миру.

GF подключается к семантической сети через лимон:

Lemon - это предлагаемая модель для моделирования лексики и машиночитаемых словарей, связанная с семантической сетью и облаком связанных данных. Она была разработана для решения следующих задач:

  • RDF-нативная форма, позволяющая использовать существующие технологии семантической сети (SPARQL, OWL, RIF и т. Д.).
    • Лингвистически обоснованная структура на основе LMF для возможности преобразования в существующие офлайн-форматы.
    • Разделение слоев лексики и онтологии для обеспечения совместимости с существующими моделями OWL.
    • Связывание с категориями данных, чтобы обеспечить произвольно сложное лингвистическое описание.

Таким образом, чтобы ответить на ваш первый вопрос, GF и OWL дополняют друг друга. GF - это, по сути, набор грамматических правил, которые можно отображать между языками, но в зависимости от поставленной задачи вы можете использовать GF для разработки мощных инструментов семантической паутины. Например, GF может использоваться для вербализации онтологий, как это было продемонстрировано в работах с лимоном.

По второму вопросу, да. Поскольку промежуточный уровень GF представляет собой набор логических правил, вам больше не нужен анализатор. Может быть достаточно морфологии и базового синтаксического сопоставления (опять же, какова ваша цель? Как говорится в определении, GF охватывает базовый синтаксис.)

Что касается WordNet:

WordNet® - это большая лексическая база данных английского языка. Существительные, глаголы, прилагательные и наречия сгруппированы в наборы когнитивных синонимов (synsets), каждый из которых выражает отдельную концепцию. Синсеты взаимосвязаны посредством концептуально-семантических и лексических отношений.

WordNet можно воспринимать как онтологию, но это не так. Это даже нельзя назвать лингвистической онтологией. Наличие гиперных и гипонимных отношений не превращает набор данных в онтологию.

Лимон или онтлекс пытаются создать онтологию, которую можно использовать в лингвистических целях. Этой целью могут быть аннотации, изучение корпусов, словари моделирования и т. Д. Однако сила WordNet заключается в его синтаксисах (слова из одной и той же лексической категории, которые примерно синонимичны, группируются в синтаксисы.); но сила RDF/OWL находится в пределах логического вывода.

За 4 года, прошедшие с тех пор, как этот вопрос впервые был задан, в GF произошли некоторые обновления. Самое главное, что теперь у нас есть WordNet, портированный на GF, в настоящее время для 13 языков, с полными таблицами перегиба. Вы можете найти репозиторий в https://github.com/GrammaticalFramework/gf-wordnet и многоязычный веб-интерфейс в http://www.grammaticalframework.org/~krasimir/gf-wordnet.html. Некоторые примеры использования интерфейса:

Другие вопросы по тегам