Извлечение изображений из pdf с помощью pikepdf

Question

Извлечение изображений из pdf с помощью pikepdf

У меня есть PDF-файл с одной страницей и изображением. Я хочу извлечь изображение с помощью библиотеки pikepdf.

Я выполнил инструкции здесь, но, по-видимому, мое изображение, я не знаю, разделено / составлено из нескольких изображений, потому что, когда я запускаю:

      from pikepdf import open as pike_open
from pikepdf import PdfImage

pdf = open('some_file.pdf')
page = pdf.pages[0]
list(page.images.keys())

Я получил:

      ['/Im11',
 '/Im12',
 '/Im13',
 '/Im14',
 '/Im15',
 '/Im16',
 '/Im17',
 '/Im18',
 '/Im5',
 '/Im7',
 '/Im9']

И если я продолжу:

      rawimage = page.images['/Im11']
pdf_image = PdfImage(rawimage)
pdf_image.extract_to('image')

Я получаю файл image.jpg, содержащий только верхнюю часть исходного изображения в формате PDF. Как я могу извлечь изображение целиком?

0

python-3.x pikepdf

Источник

user8543252 27 апр '21 в 11:25

0 ответов

Другие вопросы по тегам python-3.x pikepdf