Можно ли распаковать PDF с помощью Adobe Acrobat или Acrobat Distiller?
Большинство файлов PDF, найденных в Интернете, содержат сжатые и нечитаемые потоки данных. Можно ли распаковать внутреннее содержимое файла PDF с помощью Acrobat или Acrobat Distiller, что позволяет нам читать исходный код с помощью текстового редактора?
PS Этот вопрос вдохновлен этим ответом, который объясняет, как это можно сделать с помощью GhostScript.
3 ответа
С помощью Adobe Acrobat вы можете получить внутреннюю структуру после профилирования PDF (предварительная проверка с некоторым профилем (например, обнаружение синтаксических ошибок PDF), затем Параметры-> Внутренняя структура PDF) - но нет способа получить что-то редактируемое с помощью текстового редактора.
qpdf
а также pdftk
уже упоминалось. Чтобы показать команды:
$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress
mutool, однако, еще не был упомянут:
$ mutool clean -d -a orig.pdf uncompressed-orig.pdf
mutool
это инструмент командной строки, который поставляется вместе с облегченным средством просмотра документов MuPDF PDF +.
Я не думаю, что вы можете добиться распаковки потоков объектов PDF с помощью Acrobat или Distiller (если у вас нет дополнительных плагинов платного программного обеспечения).
Используйте cpdf:
cpdf -decompress in.pdf -o out.pdf
и тогда графические операторы для каждой страницы можно прочитать в текстовом редакторе. Вам понадобится копия стандарта в качестве ссылки, однако.
Раскрытие: я автор cpdf.