Существует ли библиотека Python, которая "понимает" SKOS, особенно концепцию altLabel-/pref-Label-Concept?
Я хочу аннотировать пару XML-файлов с помощью немецкого тезауруса STW для экономики. Вы можете получить файлы здесь в виде ZIP-архивов в RDF/XML, N3 и Turtle (~14 МБ каждый).
Поэтому я написал Python-Script, который удаляет стоп-слова, лемматизирует и выполняет тегирование части речи. Теперь я хочу проверить, есть ли существительное в одном из XML-файлов в STW-онтологии. Если да, я хотел бы сделать другие варианты для более поздней автоматизированной классификации:
- Если это
skos:altLabel
Word, заменяя его наskos:prefLabel
слово - Ничего не делать с текстом, но добавить
skos:prefLabels
в конце файла с подсчетом появленийskos:prefLabel
и связанныйskos:altLabels
- Используя, например,
skos:broader
найти, например, секторы экономики или товары, связанные сskos:prefLabel
,
Я знаю GATE и Apolda, которые могут это сделать, но они основаны на Java, и я хотел бы в конце сделать все из одного Python-Script.
Есть какие-нибудь предложения?
1 ответ
Я не знаю, действительно ли это то, что вы ищете, но для работы с RDF у вас есть RDFLib.
Вы можете получить больше рекомендаций в инструментах / библиотеках, указанных в этом ответе или здесь.
Надеюсь, что это может помочь!:)