pytesser - следующая строка текста в изображении?

Я использую pytesser на простых изображениях с простым текстом. Работает отлично! Однако в python он печатает каждую строку текста на новой строке. Но строка, которую она выводит, не имеет разделителей "\n" или новых строк, которые я могу извлечь.

Как он печатает каждую новую строку изображения на новой строке в консоли? И есть ли способ, которым я могу вытащить определенную линию? или разделить их самому?

Скорее всего, что-то очень простое я пропускаю...

from pytesser import *
image = Image.open('image.jpg') 

text =  image_to_string(image)

print len(text)
print text 

Выход:

983
BACK RASHER 1.24
T CREAM 250ML 1.19
T COFFEE 200G 1.09
PEANUT BUTTER 1.12
DIET COKE * 2.39

1 ответ

Решение

Спасибо dlask за указание на мою ошибку. repr() показывает вывод в том виде, в каком его видит интерпретатор, вместе с разделителями новой строки "\n". Используя text.split("\n"), я могу разделить вывод на строку построчно. Спасибо, черт возьми!

from pytesser import *
image = Image.open('image.jpg')  # Open image object using PIL

text =  image_to_string(image)     # Run tesseract.exe on image

print(repr(text))
result = text.split("\n")

print result
Другие вопросы по тегам