Можно ли распаковать PDF с помощью Adobe Acrobat или Acrobat Distiller?

Большинство файлов PDF, найденных в Интернете, содержат сжатые и нечитаемые потоки данных. Можно ли распаковать внутреннее содержимое файла PDF с помощью Acrobat или Acrobat Distiller, что позволяет нам читать исходный код с помощью текстового редактора?

PS Этот вопрос вдохновлен этим ответом, который объясняет, как это можно сделать с помощью GhostScript.

3 ответа

Решение

Это легко с qpdf и pdftk.

С помощью Adobe Acrobat вы можете получить внутреннюю структуру после профилирования PDF (предварительная проверка с некоторым профилем (например, обнаружение синтаксических ошибок PDF), затем Параметры-> Внутренняя структура PDF) - но нет способа получить что-то редактируемое с помощью текстового редактора.

qpdf а также pdftk уже упоминалось. Чтобы показать команды:

$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress

mutool, однако, еще не был упомянут:

$ mutool clean -d -a orig.pdf uncompressed-orig.pdf

mutool это инструмент командной строки, который поставляется вместе с облегченным средством просмотра документов MuPDF PDF +.

Я не думаю, что вы можете добиться распаковки потоков объектов PDF с помощью Acrobat или Distiller (если у вас нет дополнительных плагинов платного программного обеспечения).

Используйте cpdf:

cpdf -decompress in.pdf -o out.pdf

и тогда графические операторы для каждой страницы можно прочитать в текстовом редакторе. Вам понадобится копия стандарта в качестве ссылки, однако.

Раскрытие: я автор cpdf.

Другие вопросы по тегам