Недостаточно памяти с Wand.Image

Я новичок в OCR, пытаюсь прочитать файл PDF с изображениями Wand Image.

Код работает нормально, когда количество страниц меньше, чем около 50. Но по мере увеличения количества страниц у меня заканчиваются проблемы с памятью. У меня 16 гб оперативки

PATH = 'samplepdf.pdf'
JPEG = '.jpeg'
def read_pdf(number_of_page, path):
    index = number_of_page 
    with WImage(filename=path, resolution=300) as img:
        img.alpha_channel = 'remove'
        img.background_color = Color("white")
        img.format = 'jpeg'
        path = path + JPEG
        img.save(filename=path)

Я могу заставить его использовать меньше памяти, когда я уменьшу параметр разрешения. Но поскольку оптическое распознавание текста работает очень плохо при низком разрешении, я должен использовать его при 300.

0 ответов

Другие вопросы по тегам