Результаты Tesseract 4.0 OCR противоречивы

Мы пытаемся выполнить ocr для изображения с 2 символами, и команда tesseract возвращает неверный вывод.

Тессеракт обработанное изображение

Очевидно, ожидаемый результат должен быть телевизор, но мы получаем AY.

Еще один тессеракт обработанного изображения

Результатом должен был стать S7 Ep7, но мы получаем [Sa aes]. Который, как вы можете видеть, даже не близко.

Обработанные тессерактом изображения выглядят довольно четко, и они должны работать над ними, но получение таких противоречивых результатов на чистых изображениях сбивает с толку.

Любые идеи о том, как мы можем достичь лучшего результата.

Для подобного изображения мы начинаем получать правильный результат. Пример. Правильный результат изображения

Как вы можете видеть, это похожие изображения с несколькими пикселями вверх и вниз. Но они дают совершенно разные результаты.

0 ответов

Другие вопросы по тегам