Каковы различия в данных между live.dbpedia.org, dbpedia.org и дампом данных dbpedia?
Я понимаю, что live.dbpedia.org ближе к версии данных dbpedia.org в реальном времени, но здесь возникает вопрос, как часто выполняется обычный процесс извлечения / обновления dbpedia? Как часто обновляются дампы данных? Также было сказано, что основная конечная точка включает в себя другие наборы данных в дополнение к тому, что извлечено из Википедии.
Каковы различия в данных между dbpedia.org, live.dbpedia.org и дампами данных?
1 ответ
Я провел некоторое исследование по DBpedia для проекта и собираюсь поделиться тем, что узнал:
http://dbpedia.org/sparql: эта конечная точка использует большинство наборов данных из http://wiki.dbpedia.org/Downloads2014 ( WayBackMachineLink). Полный список наборов данных, которые он использует, и немного больше информации можно найти на этом сайте: Наборы данных Loaded 2014 ( WayBackMachineLink). Так как часто обновляются Загрузки? Смотрите список изменений в Загрузках.
http://live.dbpedia.org/sparql: эта конечная точка использует данные из DBpedia live. Если вы посмотрите на живые наборы изменений, вы увидите, что иногда они обновляются, по крайней мере, каждый час, иногда, как в сентябре 2014 года, только один раз в месяц. DBpedia говорит об этом:
Q: Живые обновления DBpedia (changesets) имеют структуру год / месяц / день / час /xxxx.nt.gz. Что это значит, если между ними есть пробелы, например, отсутствует папка на час?
A: Это означает, что служба была недоступна в то время.
И DBpedia Live - 3. Новые функции ( WayBackMachineLink) говорит:
5.Разработка инструмента синхронизации. Инструмент синхронизации позволяет зеркалу DBpedia Live оставаться в синхронизации с нашей конечной точкой. Он последовательно загружает файлы наборов изменений, распаковывает их и интегрирует с другим зеркалом DBpedia Live.
Поэтому я думаю, что если вы применяете синхронизацию с действующей конечной точкой при применении набора изменений, то действующая конечная точка также применяет набор изменений.