Использование pytesseract для создания PDF из изображения

Я использую следующий код для создания PDF из изображения.

PDF=pytesseract.image_to_pdf_or_hocr(test_image,lang='dan',config='',nice=0,extension='pdf')

и тип переменной PDF отображается как БАЙТЫ.

КАК опубликовать или получить PDF-файл?

1 ответ

Я нашел ответ. Просто чтобы закрыть ветку, выкладываю тоже самое.

 f = open("demofile.pdf", "w+b")
 f.write(bytearray(pdf))
 f.close()

demofile.pdf является результирующим pdf, который публикуется в рабочей области.

Из Pytesseract-PYPI:

Получите PDF-файл с возможностью поиска

pdf = pytesseract.image_to_pdf_or_hocr('test.png', extension='pdf')
with open('test.pdf', 'w+b') as f:
    f.write(pdf) # pdf type is bytes by default
Другие вопросы по тегам