Лучший формат файла, чем PDF или EPUB?
Мой клиент хочет, чтобы мы создали пользовательский просмотрщик документов для их приложения. (Это действительно, действительно должно быть на заказ, потому что есть тонна специфичных для приложения функций, которые им нужны.)
В прошлом году мы создали один для них, который брал PDF-файлы, генерировал изображения страниц и создавал резервные копии изображений, используя скрытый слой текста, который можно было выбрать и скопировать. Мы сделали это во Flex. Это был кошмар. PDF ужасен
В этом году нам нужно создать один из них в HTML 5 с аналогичными требованиями, за исключением того, что большинство документов теперь в формате Word или HTML, то есть они имеют текст, который можно перерабатывать, вместо фиксированного макета и символов PDF. Но они все еще хотят делать PDF в том же самом просмотрщике.
Я думаю, что нам нужно преобразовать все документы в какой-то общий формат файла, который может обрабатывать как переформатируемый текст, так и глифы PDF с фиксированным положением. (Каждый документ, вероятно, будет поддерживать один или другой, но не оба). Было бы хорошо, если бы это был XML-подобный язык разметки, который сказал бы:
<text>here's some text</text>
-- or --
<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
или что-то типа того.
Есть ли какой-либо существующий формат файла, который может с этим справиться? EPUB не будет делать текст с фиксированной позицией, а PDF - это слишком много способов описать.
2 ответа
Грофф? Возможно, при необходимости создайте библиотеку макросов, чтобы настроить ее.
Groff / troff / nroff, "прогоняющие" программы Unix, могут выводить в postscript или HTML. Переход от postscript к PDF встроен в некоторые средства просмотра PDF; Есть также несколько существующих программ для этого, например, pstopdf.
GROFF имеет некоторые фиксированные параметры макета и некоторые параметры, похожие на потоки. С помощью GROFF практически проще основывать большую часть распечатки на текущем тексте в пределах запрещенных границ.
Я думаю, что вы можете посмотреть на формат FB2 (FictionBook 2). Это основанный на XML формат, предназначенный для публикации книг. Это включает изображения, хотя я не уверен, что они могут быть выровнены абсолютно.
Кроме того, вы можете просто перейти с HTML и выполнять рендеринг HTML в PDF при необходимости (для этого существуют различные компоненты и библиотеки). Я не вижу (или вы не перечислили) никаких причин, почему этот способ не работает.