Веб-страницы для печатных СМИ - решения?

Я был большим поклонником MediaWiki и подобных текстовых редакторов на основе вики. Мне нравится возможность быстро добавлять текст, сотрудничать и делиться. Тем не менее, всегда есть потребность в красиво отформатированном выводе на печать. Такие вещи, как верхние и нижние колонтитулы (которые говорят то, что я хочу, чтобы они сказали), разрывы страниц, поля и т. Д.

Большинство решений, которые я видел, включают какое-то преобразование в промежуточный формат печатных носителей (может быть, MediaWiki в Microsoft Word или, может быть, какой-то нестандартный сценарий, который генерирует PDF из содержимого веб-страницы (с большим количеством жестко закодированных ссылок),

Есть ли более общее решение, которое существует для этой проблемы? Любая структура, которая стремится объединить HTML и веб-контент в целом в формат вывода на печать?

Любые решения, обсуждения относительно плюсов или минусов, или что-либо приветствуется.

Спасибо!

Обновление: я думаю, что CSS только поможет мне, хотя... Я использовал CSS для вывода аналогичного типа (MediaWiki по умолчанию имеет формат печати, который скрывает большую часть материала навигационной панели). Впрочем, подумайте о статье в MediaWiki - представьте, что я могу настроить тег в содержимом или что-то подобное, и теперь мое поле составляет 1 дюйм вместо 0,5 дюйма. Это больше похоже на то, к чему я стремлюсь.

6 ответов

Решение

Возможно, вы слышали о PediaPress, компании, которая заключила соглашение "Wiki для печати" (т. Е. PDF, но также ODF) с Фондом Викимедиа. (См. "Wikis Go Printable".) Их код предназначен для работы с MediaWiki и имеет открытый исходный код.

Но! Это даже лучше, чем это. Проверьте этот букмарклет. Вы можете использовать его для создания PDF-файлов или ODF-файлов на любой общедоступной странице MediaWiki (возможно, для этого нужно, чтобы API тоже был включен...). И вы можете объединить несколько страниц из одного MediaWiki или нескольких MediaWikis в один документ. Это чертовски круто в моей книге.:)

ETA: PediaPress приложили немало усилий, чтобы сделать что-то действительно приятное для чтения. Это не просто эквивалент печатной версии MediaWiki, конвертированной в PDF.

http://www.princexml.com/

может быть что-то для вас. Он преобразует XML и HTML-страниц в PDF-документы.

Использование CSS-файлов для печати - очень удобный способ переформатирования страниц для печати.

Многие люди возвращаются к PDF, потому что он может быть более мощным и простым.

Однако для большинства вещей разметка CSS проще и проще.

Посмотрите на источник страниц в Stackru, и вы увидите ссылки на media="print" (print.css)- набор стилей, применяемый только тогда, когда браузер печатает страницу.

<link href="/Content/print.css" rel="stylesheet" media="print" type="text/css" />

Вы можете использовать их, чтобы скрыть навигационные панели, рекламу (или показывать другую рекламу). Сделать некоторые основные нумерации страниц и т. Д.

Если вам нужен больший контроль над такими вещами, как поля, вы должны выйти из браузера (PDF, Word, XPS и т. Д.).

В общем, используйте стили печати CSS + какой-либо инструмент веб-страницы в PDF ( безголовый Chrome, Electron, https://wkhtmltopdf.org/, Prince XML или просто функцию печати в PDF вашего веб-браузера, если вам не требуется автоматизировать ее).

Специально для MediaWiki расширение ElectronPdfService сделает это за вас. (Кроме того, стили печати переписываются прямо сейчас; вернитесь через месяц или два для улучшения представления.)

Я написал конвертер MediaWiki в LaTeX, который пытается поддерживать структуру документа исходного текста. Затем документ набирается с помощью pdflatex для создания очень качественного, разбитого на страницы документа. Математическая разметка напрямую отображается в LaTeX, поэтому уравнения выглядят великолепно. Документ-класс / таблица стилей LaTeX настраивается из специализированных команд в вики для непосредственного управления полями, макетом страницы, шрифтами, дополнительными пакетами и так далее. Это относится к вашей второй категории пользовательских сценариев, а не к общей структуре.

Есть много других, таких как Расширение: Pdf_Export, которое использует htmldoc. Хотя он более общий, он очень плохо разбивает на страницы и создает много вдов и сирот, не выполняет оптимального выравнивания текста и не выполняет индексы, рисунки, ссылки на себя и т. Д. Кроме того, если вы используете < Разметка math> в MediaWiki включает только PNG-файлы с низким разрешением.

princexml специализируется на MediaWiki и производит хорошо выглядящие документы, но недоступен по свободной лицензии. Поскольку это продукт с закрытым исходным кодом, ваша способность контролировать выход ограничена.

<style type="text/css">
    @media print {
        /***css rules for print mode ***/
        aside#sidebar, header[role="banner"], footer, #comments, #respond, #header-v1, .breadcrumbs, #footer-v1,.topbar-v1,.header-v1,.fcbtnremove {
            display: none;
        }

        .container.content-xs {
            width: 98%;
            margin: 0px;
            padding: 0px;
        }
    }

    @media screen {
        /***css rules for screen , it is sometiems opposite of print mode ***/
        #header-v1, .breadcrumbs, #footer-v1,.topbar-v1,.header-v1 {
            display: block;
        }
    }

    table td , table th{text-align:center;vertical-align:middle}
</style>

Проект mediawiki2latex предлагает решение.

Любая страница MediaWiki может быть преобразована в PDF, Epub, Odt или LaTeX.

Его можно использовать в Интернете на сервере Фонда Викимедиа:

https://mediawiki2latex.wmflabs.org/

Также есть опубликованная статья о проекте.

http://www.tug.org/TUGboat/tb34-2/tb107huenniger.pdf

Источник доступен под лицензией GPL. Есть неплохой пакет Debian:

sudo apt-get install mediawiki2latex
mediawiki2latex -u https://en.wikipedia.org/wiki/Epimorphism -o output.pdf
evince output.pdf
Другие вопросы по тегам