В чем преимущество тегированного PDF по сравнению с логическим PDF при переформатировании?

Я делаю просмотрщик PDF и пытаюсь сделать переформатирование. Я читаю PDF Reference 1.7

http://wwwimages.adobe.com/www.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/pdf_reference_1-7.pdf

Когда я читаю раздел "Логическая структура" (10.6), я думаю, что достаточно сделать переформатировку PDF. Поскольку я могу извлечь каждую главу, каждый заголовок, каждый абзац с макетом, я могу поместить их в xml, чтобы они отображались как веб-отображение с перекомпоновкой с помощью javascript.

Затем я прочитал раздел "Tagged PDF" (10.7), там написано, что он поддерживает перекомпоновку, я не вижу здесь никакой другой выгоды по сравнению с "Логической структурой". Кто-нибудь может мне объяснить?

Большое спасибо за ваше время!

1 ответ

Они оба связаны, логическая структура представляет собой дерево на уровне документа, где каждый узел может (или не может) иметь ссылку на помеченное содержимое (тег) на странице. Помеченный контент или теги - это то, что действительно скажет вам, какая часть страницы является абзацем, рисунком или чем-то еще. Дерево логической структуры - это просто структура документа, но, используя только это, вы не сможете обрабатывать содержимое каждой страницы.

Другие вопросы по тегам