Tessract (tessnet2 для.NET) - более 2 десятичных знаков

Я борюсь с проблемой чтения данных из таблицы. Если число имеет до 2 знаков после запятой, все выглядит нормально, когда число имеет 3 знака после запятой, я не получаю десятичную точку, т.е. (вместо 5,575 я получаю 5575).

! введите описание изображения здесь

Я также попробовал tesseract 3.02 с https://github.com/charlesw/tesseract но я обнаружил, что это менее надежно при чтении данных из источника, который я хочу прочитать, поэтому я использую старый tessnet2.

Я использую следующий белый список символов: ocr.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ.,");

и языковой пакет: английский для версии 2up.

Есть ли у вас какие-либо советы, что я могу изменить, чтобы получить более точные значения?

Спасибо джек

1 ответ

Пытаться bazaar или пользовательские шаблоны в Tesseract 3.0x.

Другие вопросы по тегам