Parsoid - разбор wikitext локально
Это вообще возможно?
Я не уверен, правильно ли я понимаю проект. Я пытаюсь разобрать большое количество вики-текста в HTML с помощью проекта Parsoid-JSAPI.
Разбор работает нормально, но он все еще вызывает API Викимедиа. Я запустил сервер локально, но библиотека все еще использует общедоступный интернет-API вместо моего локального сервера. Если я пытаюсь указать домен, звоню Parsoid.parse("wikitext", {domain: 'localhost'})
это говорит No API URI available for prefix: null; domain: localhost
Мой config.yaml:
mwApis:
uri: 'http://localhost/w/api.php'
domain: 'localhost'
1 ответ
Разбор викитекста возможен, конечно; это то, что делает Парсоид. Анализ содержимого Википедии невозможен (без вызовов API), поскольку 1) необходимо разрешать шаблоны и другой включенный контент и 2) часть разметки управляется расширениями, и Parsoid откладывает их.
Вы можете настроить локальный экземпляр MediaWiki, настроить все необходимые расширения и импортировать все соответствующие страницы (есть опция "включить шаблоны" при экспорте контента), но это требует больших усилий.