Parsoid - разбор wikitext локально

Это вообще возможно?

Я не уверен, правильно ли я понимаю проект. Я пытаюсь разобрать большое количество вики-текста в HTML с помощью проекта Parsoid-JSAPI.

Разбор работает нормально, но он все еще вызывает API Викимедиа. Я запустил сервер локально, но библиотека все еще использует общедоступный интернет-API вместо моего локального сервера. Если я пытаюсь указать домен, звоню Parsoid.parse("wikitext", {domain: 'localhost'})это говорит No API URI available for prefix: null; domain: localhost

Мой config.yaml:

mwApis:
    uri: 'http://localhost/w/api.php'
    domain: 'localhost'

1 ответ

Разбор викитекста возможен, конечно; это то, что делает Парсоид. Анализ содержимого Википедии невозможен (без вызовов API), поскольку 1) необходимо разрешать шаблоны и другой включенный контент и 2) часть разметки управляется расширениями, и Parsoid откладывает их.

Вы можете настроить локальный экземпляр MediaWiki, настроить все необходимые расширения и импортировать все соответствующие страницы (есть опция "включить шаблоны" при экспорте контента), но это требует больших усилий.

Другие вопросы по тегам