Использование dbpedia spotlight с локальными медиа-вики (не экземпляром википедии)
Я пытаюсь использовать прожектор dbpedia для определения специальных терминов (которые не включены в dbpedia), используя в качестве входных данных локальный дамп mediawiki вместо индекса по умолчанию и spotter.dict. Любые идеи будут так цениться
1 ответ
Решение
DBpedia Spotlight требует 5(пять) файлов для построения индекса следующим образом:
Формат N троек:
- Типы экземпляров: список URL-адресов и их типов (DBpedia, Freebase и т. Д.)
Например:
<YOUR_LINK> <www.w3.org/1999/02/22-rdf-syntax-ns#type> <DBpedia:Type> .
- Ярлыки: список URL-адресов и ярлыков
Например:
<YOUR_LINK> <www.w3.org/2000/01/rdf-schema#label> "Label"@en .
- Перенаправления: список URL-адресов и их страниц перенаправления
Например:
<YOUR_LINK> <dbpedia.org/ontology/wikiPageRedirects> <YOUR_LINK> .
Список неоднозначностей URL-адреса и их страницы неоднозначности
,
XML-дамп:
- Wiki dump - (например, Wikipedia Dump).
После подготовки этих файлов с вашими собственными данными, просто следуйте руководству по интернационализации, доступному в вики DBpedia Spotlight, чтобы создать индекс с вашими собственными данными.
Всего наилучшего,