Тессеракт hOCR: как обнаружить с ног на голову?

(Я отвечу на свой вопрос здесь для общего знания)

В Tesseract OCR как вы обнаруживаете изображение с ног на голову?
Люди, которые работали с Tesseract, могут знать, а могут и не знать, что Tesseract может читать изображения, которые представлены с ног на голову.
Проблема, однако, в том, что вы не знаете, что это перевернуто, если вы используете вывод hOCR, как нигде в документе сказано.

Так как это обнаружить?

1 ответ

После двойной проверки я заметил, что на самом деле он не находится непосредственно в выводе hOCR, я ожидаю некоторый атрибут в ocr_pagediv обозначает ориентацию.

Что я понял, так это то, что вы можете прочитать значения y ограничительной рамки всех ocr_careaс на страницу:

  • Если значения переходят от низкого к высокому, то страница находится в нормальной ориентации.
  • Если значения меняются от высокого к низкому, то страница перевернута.

Это может или не может работать для поворота на 90 и 270 градусов, но вполне может быть, что вы видите похожий шаблон для значения x.

Другие вопросы по тегам