Результаты Tesseract 4.0 OCR противоречивы
Мы пытаемся выполнить ocr для изображения с 2 символами, и команда tesseract возвращает неверный вывод.
Очевидно, ожидаемый результат должен быть телевизор, но мы получаем AY.
Результатом должен был стать S7 Ep7, но мы получаем [Sa aes]. Который, как вы можете видеть, даже не близко.
Обработанные тессерактом изображения выглядят довольно четко, и они должны работать над ними, но получение таких противоречивых результатов на чистых изображениях сбивает с толку.
Любые идеи о том, как мы можем достичь лучшего результата.
Для подобного изображения мы начинаем получать правильный результат. Пример. Правильный результат изображения
Как вы можете видеть, это похожие изображения с несколькими пикселями вверх и вниз. Но они дают совершенно разные результаты.