Советы по обнаружению повернутых символов (букв) с помощью tesseract ocr

В рамках студенческого проекта БПЛА нам нужно запустить OCR на серии односимвольных изображений без засечек. Это было в основном тривиально, используя Tesseract OCR, так как символы высокого разрешения и четко определены, но мы боремся с одним неизвестным - ориентация символов внутри изображения неизвестна. Анализируя окружение, мы можем сузить это, чтобы мы получили изображение для распознавания текста, где базовая линия текста выравнивается по верху, низу, левому или правому краю изображения.

Наш нынешний подход заключается в том, чтобы обучать Тессеракт, как если бы он распознавал новый язык (хотя на самом деле это просто английский с символами 0, 90, 180 и 270 градусов). Например, A следует распознавать как A, даже если он повернут на любое целое число, кратное 90 градусам.

Должно ли это быть возможно с Tesseract? Мы пытаемся выяснить, как это сделать, несмотря на длительные исследования.

Заранее спасибо.

0 ответов

Другие вопросы по тегам