Какова структура XML-файла (тегов) файла дампа вики-страниц
Я думал, что теги вики-файла дампа будут похожи
<page>
<title> </title>
<content> </content>
</page>
<page>
<title> </title>
<content> </content>
</page>
в дополнение к другим тегам. Мне удалось найти теги страницы и заголовка, но я все еще не могу найти, где находится основная статья, в теге body, или теге content, или теге article, любая помощь
1 ответ
Решение
Основная статья будет внутри тега <page>
,затем<revision>
и внутри них искать <text>