Сохранение пробелов в Тессеракте
У меня был файл изображения, который содержит текст, разделенный табуляцией (2 пробела). Но когда я извлекаю текст из этого файла изображения, я всегда получаю один пробел между двумя столбцами. Пример примера:
ОБРАЗ:
col-a col-b col-c
Желаемый результат:
col-a col-b col-c
Но я получаю следующее:
col-a col-b col-c
Я использую pytesseract.image_to_string (модуль Python) для преобразования изображения в текст
1 ответ
Используйте это так:
pytesseract.image_to_string(img, config='-c preserve_interword_spaces=1')