Существует ли библиотека Python, которая "понимает" SKOS, особенно концепцию altLabel-/pref-Label-Concept?

Я хочу аннотировать пару XML-файлов с помощью немецкого тезауруса STW для экономики. Вы можете получить файлы здесь в виде ZIP-архивов в RDF/XML, N3 и Turtle (~14 МБ каждый).

Поэтому я написал Python-Script, который удаляет стоп-слова, лемматизирует и выполняет тегирование части речи. Теперь я хочу проверить, есть ли существительное в одном из XML-файлов в STW-онтологии. Если да, я хотел бы сделать другие варианты для более поздней автоматизированной классификации:

  • Если это skos:altLabel Word, заменяя его на skos:prefLabel слово
  • Ничего не делать с текстом, но добавить skos:prefLabels в конце файла с подсчетом появлений skos:prefLabel и связанный skos:altLabels
  • Используя, например, skos:broader найти, например, секторы экономики или товары, связанные с skos:prefLabel,

Я знаю GATE и Apolda, которые могут это сделать, но они основаны на Java, и я хотел бы в конце сделать все из одного Python-Script.

Есть какие-нибудь предложения?

1 ответ

Решение

Я не знаю, действительно ли это то, что вы ищете, но для работы с RDF у вас есть RDFLib.

Вы можете получить больше рекомендаций в инструментах / библиотеках, указанных в этом ответе или здесь.

Надеюсь, что это может помочь!:)

Другие вопросы по тегам