Изменить метаданные PDF-файла с PyPDF

Я хотел бы создать / изменить заголовок документа PDF, используя pypdf. Кажется, что заголовок только для чтения. Есть ли способ получить доступ к этим метаданным?

Если ответ положительный, будет полезен кусок кода.

Спасибо

1 ответ

Вы можете манипулировать заголовком с помощью pyPDF (вроде). Я наткнулся на этот пост в списке пользователей отчета:

http://two.pairlist.net/pipermail/reportlab-users/2009-November/009033.html

Вы также можете использовать pypdf. http://pybrary.net/pyPdf/

Это не позволит вам редактировать метаданные как таковые, но позволит вам прочитать один или несколько файлов PDF и выплюнуть их обратно, возможно, с новыми метаданными.

Вот соответствующий код:

from pyPdf import PdfFileWriter, PdfFileReader
from pyPdf.generic import NameObject, createStringObject

OUTPUT = 'output.pdf'
INPUTS = ['test1.pdf', 'test2.pdf', 'test3.pdf']

# There is no interface through pyPDF with which to set this other then getting
# your hands dirty like so:
infoDict = output._info.getObject()
infoDict.update({
    NameObject('/Title'): createStringObject(u'title'),
    NameObject('/Author'): createStringObject(u'author'),
    NameObject('/Subject'): createStringObject(u'subject'),
    NameObject('/Creator'): createStringObject(u'a script')
})

inputs = [PdfFileReader(i) for i in INPUTS]
for input in inputs:
    for page in range(input.getNumPages()):
        output.addPage(input.getPage(page))

outputStream = file(OUTPUT, 'wb')
output.write(outputStream)
outputStream.close()
Другие вопросы по тегам