Рамки для семантической аннотации для определяемой пользователем модели домена
У меня есть некоторые документы и онтология для некоторых понятий. Существуют ли какие-либо структуры, которые автоматически извлекают эти понятия из данных документов и создают тройки? Онтология должна содержать специальные свойства?
Я нашел UIMA, но насколько я понял с UIMA, я могу сделать только что-то вроде этого:
- создать несколько словарей, которые поддерживают ассоциации с онтологией
- использовать этот словарь с ConceptMapper
- написать потребителя CAS, который создает тройки и сохраняет их -
Мне не нравится этот подход, потому что я должен синхронизировать понятия из онтологии и словаря.
Может ли UIMA использоваться по-другому, или существуют какие-либо расширенные структуры, которые могут напрямую использовать мою онтологию, скажем, некоторые пользовательские свойства в качестве входных данных и на основе них аннотировать документы?
Я хочу использовать онтологии в качестве модели предметной области, потому что хочу создать базу знаний, и онтологии кажутся более гибкими, чем, например, реляционная модель. Благодарю.
1 ответ
Потратив больше времени на поиск в Google, я нашел GATE, а точнее OntoRoot Gazetter и Large KB Gazetteer.
OntoRoot Gazetteer - это тип динамически создаваемого справочника, который в сочетании с несколькими другими универсальными ресурсами GATE способен создавать аннотации на основе онтологий для данного контента в отношении данной онтологии. Этот бюллетень является частью плагина Gazetteer_Ontology_Based, который был разработан в рамках проекта TAO.
Я не проверял их, но они кажутся хорошими кандидатами для решения моей проблемы.