Извлечение изображений из pdf с помощью pikepdf
У меня есть PDF-файл с одной страницей и изображением. Я хочу извлечь изображение с помощью библиотеки pikepdf.
Я выполнил инструкции здесь, но, по-видимому, мое изображение, я не знаю, разделено / составлено из нескольких изображений, потому что, когда я запускаю:
from pikepdf import open as pike_open
from pikepdf import PdfImage
pdf = open('some_file.pdf')
page = pdf.pages[0]
list(page.images.keys())
Я получил:
['/Im11',
'/Im12',
'/Im13',
'/Im14',
'/Im15',
'/Im16',
'/Im17',
'/Im18',
'/Im5',
'/Im7',
'/Im9']
И если я продолжу:
rawimage = page.images['/Im11']
pdf_image = PdfImage(rawimage)
pdf_image.extract_to('image')
Я получаю файл image.jpg, содержащий только верхнюю часть исходного изображения в формате PDF. Как я могу извлечь изображение целиком?