Веб-страницы для печатных СМИ - решения?
Я был большим поклонником MediaWiki и подобных текстовых редакторов на основе вики. Мне нравится возможность быстро добавлять текст, сотрудничать и делиться. Тем не менее, всегда есть потребность в красиво отформатированном выводе на печать. Такие вещи, как верхние и нижние колонтитулы (которые говорят то, что я хочу, чтобы они сказали), разрывы страниц, поля и т. Д.
Большинство решений, которые я видел, включают какое-то преобразование в промежуточный формат печатных носителей (может быть, MediaWiki в Microsoft Word или, может быть, какой-то нестандартный сценарий, который генерирует PDF из содержимого веб-страницы (с большим количеством жестко закодированных ссылок),
Есть ли более общее решение, которое существует для этой проблемы? Любая структура, которая стремится объединить HTML и веб-контент в целом в формат вывода на печать?
Любые решения, обсуждения относительно плюсов или минусов, или что-либо приветствуется.
Спасибо!
Обновление: я думаю, что CSS только поможет мне, хотя... Я использовал CSS для вывода аналогичного типа (MediaWiki по умолчанию имеет формат печати, который скрывает большую часть материала навигационной панели). Впрочем, подумайте о статье в MediaWiki - представьте, что я могу настроить тег в содержимом или что-то подобное, и теперь мое поле составляет 1 дюйм вместо 0,5 дюйма. Это больше похоже на то, к чему я стремлюсь.
6 ответов
Возможно, вы слышали о PediaPress, компании, которая заключила соглашение "Wiki для печати" (т. Е. PDF, но также ODF) с Фондом Викимедиа. (См. "Wikis Go Printable".) Их код предназначен для работы с MediaWiki и имеет открытый исходный код.
Но! Это даже лучше, чем это. Проверьте этот букмарклет. Вы можете использовать его для создания PDF-файлов или ODF-файлов на любой общедоступной странице MediaWiki (возможно, для этого нужно, чтобы API тоже был включен...). И вы можете объединить несколько страниц из одного MediaWiki или нескольких MediaWikis в один документ. Это чертовски круто в моей книге.:)
ETA: PediaPress приложили немало усилий, чтобы сделать что-то действительно приятное для чтения. Это не просто эквивалент печатной версии MediaWiki, конвертированной в PDF.
может быть что-то для вас. Он преобразует XML и HTML-страниц в PDF-документы.
Использование CSS-файлов для печати - очень удобный способ переформатирования страниц для печати.
Многие люди возвращаются к PDF, потому что он может быть более мощным и простым.
Однако для большинства вещей разметка CSS проще и проще.
Посмотрите на источник страниц в Stackru, и вы увидите ссылки на media="print"
(print.css)- набор стилей, применяемый только тогда, когда браузер печатает страницу.
<link href="/Content/print.css" rel="stylesheet" media="print" type="text/css" />
Вы можете использовать их, чтобы скрыть навигационные панели, рекламу (или показывать другую рекламу). Сделать некоторые основные нумерации страниц и т. Д.
Если вам нужен больший контроль над такими вещами, как поля, вы должны выйти из браузера (PDF, Word, XPS и т. Д.).
В общем, используйте стили печати CSS + какой-либо инструмент веб-страницы в PDF ( безголовый Chrome, Electron, https://wkhtmltopdf.org/, Prince XML или просто функцию печати в PDF вашего веб-браузера, если вам не требуется автоматизировать ее).
Специально для MediaWiki расширение ElectronPdfService сделает это за вас. (Кроме того, стили печати переписываются прямо сейчас; вернитесь через месяц или два для улучшения представления.)
Я написал конвертер MediaWiki в LaTeX, который пытается поддерживать структуру документа исходного текста. Затем документ набирается с помощью pdflatex для создания очень качественного, разбитого на страницы документа. Математическая разметка напрямую отображается в LaTeX, поэтому уравнения выглядят великолепно. Документ-класс / таблица стилей LaTeX настраивается из специализированных команд в вики для непосредственного управления полями, макетом страницы, шрифтами, дополнительными пакетами и так далее. Это относится к вашей второй категории пользовательских сценариев, а не к общей структуре.
Есть много других, таких как Расширение: Pdf_Export, которое использует htmldoc. Хотя он более общий, он очень плохо разбивает на страницы и создает много вдов и сирот, не выполняет оптимального выравнивания текста и не выполняет индексы, рисунки, ссылки на себя и т. Д. Кроме того, если вы используете < Разметка math> в MediaWiki включает только PNG-файлы с низким разрешением.
princexml специализируется на MediaWiki и производит хорошо выглядящие документы, но недоступен по свободной лицензии. Поскольку это продукт с закрытым исходным кодом, ваша способность контролировать выход ограничена.
<style type="text/css">
@media print {
/***css rules for print mode ***/
aside#sidebar, header[role="banner"], footer, #comments, #respond, #header-v1, .breadcrumbs, #footer-v1,.topbar-v1,.header-v1,.fcbtnremove {
display: none;
}
.container.content-xs {
width: 98%;
margin: 0px;
padding: 0px;
}
}
@media screen {
/***css rules for screen , it is sometiems opposite of print mode ***/
#header-v1, .breadcrumbs, #footer-v1,.topbar-v1,.header-v1 {
display: block;
}
}
table td , table th{text-align:center;vertical-align:middle}
</style>
Проект mediawiki2latex предлагает решение.
Любая страница MediaWiki может быть преобразована в PDF, Epub, Odt или LaTeX.
Его можно использовать в Интернете на сервере Фонда Викимедиа:
https://mediawiki2latex.wmflabs.org/
Также есть опубликованная статья о проекте.
http://www.tug.org/TUGboat/tb34-2/tb107huenniger.pdf
Источник доступен под лицензией GPL. Есть неплохой пакет Debian:
sudo apt-get install mediawiki2latex
mediawiki2latex -u https://en.wikipedia.org/wiki/Epimorphism -o output.pdf
evince output.pdf