Импорт Pytesseract

Я пытаюсь использовать pytesseract для распознавания текста (извлечение текста из изображения). Я успешно установил pytessearct с помощью команды -

pip install pytessearct

Когда я пытаюсь установить его снова, он ясно говорит -

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages

Это означает, что pytessearct успешно установлен. Когда я пытаюсь импортировать этот пакет в свой ноутбук iPython, используя -

import pytessearct

Выдает ошибку -

ImportError: No module named pytesseract

Почему это происходит?

1 ответ

Чтобы использовать Python-tesseract - требуется python 2.5+ или python 3.x - сначала вы должны установить пакеты PIL и pytesseract через pip:

pip install Pillow
pip install pytesseract

Затем вы должны загрузить и установить OCR:

https://sourceforge.net/projects/tesseract-ocr-alt/?source=typ_redirect

Насколько я знаю, он автоматически добавляет его в переменную PATH.

Тогда используйте это так:

import pytesseract
from PIL import Image

img = Image.open('Capture.PNG')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
print( pytesseract.image_to_string(img) )

Я надеюсь, что это помогает:)

Другие вопросы по тегам