Импорт Pytesseract
Я пытаюсь использовать pytesseract для распознавания текста (извлечение текста из изображения). Я успешно установил pytessearct с помощью команды -
pip install pytessearct
Когда я пытаюсь установить его снова, он ясно говорит -
Requirement already satisfied (use --upgrade to upgrade):
pytesseract in ./site-packages
Это означает, что pytessearct успешно установлен. Когда я пытаюсь импортировать этот пакет в свой ноутбук iPython, используя -
import pytessearct
Выдает ошибку -
ImportError: No module named pytesseract
Почему это происходит?
1 ответ
Чтобы использовать Python-tesseract - требуется python 2.5+ или python 3.x - сначала вы должны установить пакеты PIL и pytesseract через pip:
pip install Pillow
pip install pytesseract
Затем вы должны загрузить и установить OCR:
https://sourceforge.net/projects/tesseract-ocr-alt/?source=typ_redirect
Насколько я знаю, он автоматически добавляет его в переменную PATH.
Тогда используйте это так:
import pytesseract
from PIL import Image
img = Image.open('Capture.PNG')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
print( pytesseract.image_to_string(img) )
Я надеюсь, что это помогает:)