Рамки для семантической аннотации для определяемой пользователем модели домена

У меня есть некоторые документы и онтология для некоторых понятий. Существуют ли какие-либо структуры, которые автоматически извлекают эти понятия из данных документов и создают тройки? Онтология должна содержать специальные свойства?

Я нашел UIMA, но насколько я понял с UIMA, я могу сделать только что-то вроде этого:

  • создать несколько словарей, которые поддерживают ассоциации с онтологией
  • использовать этот словарь с ConceptMapper
  • написать потребителя CAS, который создает тройки и сохраняет их -

Мне не нравится этот подход, потому что я должен синхронизировать понятия из онтологии и словаря.

Может ли UIMA использоваться по-другому, или существуют какие-либо расширенные структуры, которые могут напрямую использовать мою онтологию, скажем, некоторые пользовательские свойства в качестве входных данных и на основе них аннотировать документы?

Я хочу использовать онтологии в качестве модели предметной области, потому что хочу создать базу знаний, и онтологии кажутся более гибкими, чем, например, реляционная модель. Благодарю.

1 ответ

Потратив больше времени на поиск в Google, я нашел GATE, а точнее OntoRoot Gazetter и Large KB Gazetteer.

OntoRoot Gazetteer - это тип динамически создаваемого справочника, который в сочетании с несколькими другими универсальными ресурсами GATE способен создавать аннотации на основе онтологий для данного контента в отношении данной онтологии. Этот бюллетень является частью плагина Gazetteer_Ontology_Based, который был разработан в рамках проекта TAO.

Я не проверял их, но они кажутся хорошими кандидатами для решения моей проблемы.

Другие вопросы по тегам