Декодер преобразования изображения в текст
Я хочу преобразовать следующее изображение в текст:
Я уже пробовал использовать Tesseract OCR для своих целей, но пока мне не повезло.
Вот мой код:
import pytesseract
import sys
import argparse
try:
import Image
except ImportError:
from PIL import Image
from subprocess import check_output
def resolve(path):
check_output(['C:\Program Files\ImageMagick-7.0.9-Q16\convert.exe', path, '-resample', '600', path])
return pytesseract.image_to_string(Image.open(path))
if __name__=="__main__":
argparser = argparse.ArgumentParser()
argparser.add_argument('path',help = 'image path at OCR')
args = argparser.parse_args()
path = args.path
print('Resolving the image...')
captcha_text = resolve(path)
print('Result: ',captcha_text)`
Вот результат моей программы:
C:\Users\Foussy\PycharmProjects\03_Imagedecoder>python main.py C:\Users\Foussy\Pictures\4570502--437826.jpeg
Resolving the image...
Result:
Кажется, моя программа не может расшифровать картинку. Я пытался расшифровать изображения с более "очевидным" текстом, и у меня это получалось хорошо. Я также безуспешно пробовал несколько других примеров этого типа капчи. Что вы мне посоветуете делать?
Дело в том, что, в конце концов, я хотел бы написать программу, которая автоматически декодирует такие изображения, поэтому, если нет надежного способа автоматически изменять изображения таким образом, чтобы сделать Tesseract совместимым с, я не вижу другого способа решите эту проблему. Если кто-то знает определенную библиотеку или что-то в этом роде... Было бы полезно.
1 ответ
Эта библиотека python может помочь https://pypi.org/project/captcha-solver/