Использование dbpedia spotlight с локальными медиа-вики (не экземпляром википедии)

Я пытаюсь использовать прожектор dbpedia для определения специальных терминов (которые не включены в dbpedia), используя в качестве входных данных локальный дамп mediawiki вместо индекса по умолчанию и spotter.dict. Любые идеи будут так цениться

1 ответ

Решение

DBpedia Spotlight требует 5(пять) файлов для построения индекса следующим образом:

Формат N троек:

  • Типы экземпляров: список URL-адресов и их типов (DBpedia, Freebase и т. Д.)

Например:

   <YOUR_LINK> <www.w3.org/1999/02/22-rdf-syntax-ns#type> <DBpedia:Type> .
  • Ярлыки: список URL-адресов и ярлыков

Например:

   <YOUR_LINK> <www.w3.org/2000/01/rdf-schema#label> "Label"@en .
  • Перенаправления: список URL-адресов и их страниц перенаправления

Например:

   <YOUR_LINK> <dbpedia.org/ontology/wikiPageRedirects> <YOUR_LINK> .
  • Список неоднозначностей URL-адреса и их страницы неоднозначности

    ,

XML-дамп:

  • Wiki dump - (например, Wikipedia Dump).

После подготовки этих файлов с вашими собственными данными, просто следуйте руководству по интернационализации, доступному в вики DBpedia Spotlight, чтобы создать индекс с вашими собственными данными.

Всего наилучшего,

Другие вопросы по тегам