Tesseract OCR Engine с открытым исходным кодом v3.05.00dev с предупреждением Leptonica в pixReadMemPng
Я пытаюсь преобразовать файл изображения PNG в текст, используя pytesseract. Это дает мне ошибку ниже.
TesseractError: (1, 'Tesseract Open Source OCR Engine v3.05.00dev с Leptonica Предупреждение в pixReadMemPng: обходной путь: запись во временный файл предупреждение libpng: приложение, созданное с libpng-1.4.3, но работающее с ошибкой 1.5.14 в pixReadStreamPng: png_ptr не сделано Ошибка в pixReadMemPng: pix не читается Ошибка в pixReadMem: png: ни один pix не возвращен Ошибка во время обработки.')
Когда я делаю тессеракт -v
тессеракт 3.05.00дев
leptonica-1,72
libjpeg 9: libpng 1.5.14: libtiff 4.0.3: zlib 1.2.5: libopenjp2 2.1.0
2 ответа
Я также сталкиваюсь с этой проблемой, и я не могу найти ответ в Интернете.
Но я пытаюсь скачать tesseract-ocr и установить его, а затем:
- установить переменную окружения,
TESSDATA_PREFIX:"C:\Program Files (x86)\Tesseract-OCR\tessdata"
- добавлять
C:\Program Files (x86)\Tesseract-OCR
к переменной пути. - редактировать
pytesseract.py
в строке 35,tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
Когда я звоню pytesseract.image_to_string(img)
в подсказке anaconda возвращает строку. Моя среда :
- pytesseract 0.2.6
- подушка 5.2.0
- тессеракт 4.00.00альфа
Я столкнулся с той же проблемой:
На моем компьютере версия tesseract engine была 3.0.
когда я установил движок tesseract версии 5.0 или выше и использовал его путь как
pytesseract.pytesseract.tesseract_cmd=r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"