Сохранение пробелов в Тессеракте

У меня был файл изображения, который содержит текст, разделенный табуляцией (2 пробела). Но когда я извлекаю текст из этого файла изображения, я всегда получаю один пробел между двумя столбцами. Пример примера:

ОБРАЗ:

col-a    col-b    col-c

Желаемый результат:

col-a    col-b    col-c

Но я получаю следующее:

col-a col-b col-c

Я использую pytesseract.image_to_string (модуль Python) для преобразования изображения в текст

1 ответ

Используйте это так:

pytesseract.image_to_string(img, config='-c preserve_interword_spaces=1')
Другие вопросы по тегам