Использование pytesseract для создания PDF из изображения
Я использую следующий код для создания PDF из изображения.
PDF=pytesseract.image_to_pdf_or_hocr(test_image,lang='dan',config='',nice=0,extension='pdf')
и тип переменной PDF отображается как БАЙТЫ.
КАК опубликовать или получить PDF-файл?
1 ответ
Я нашел ответ. Просто чтобы закрыть ветку, выкладываю тоже самое.
f = open("demofile.pdf", "w+b")
f.write(bytearray(pdf))
f.close()
demofile.pdf является результирующим pdf, который публикуется в рабочей области.
Из Pytesseract-PYPI:
Получите PDF-файл с возможностью поиска
pdf = pytesseract.image_to_pdf_or_hocr('test.png', extension='pdf')
with open('test.pdf', 'w+b') as f:
f.write(pdf) # pdf type is bytes by default