Тессеракт hOCR: как обнаружить с ног на голову?
(Я отвечу на свой вопрос здесь для общего знания)
В Tesseract OCR как вы обнаруживаете изображение с ног на голову?
Люди, которые работали с Tesseract, могут знать, а могут и не знать, что Tesseract может читать изображения, которые представлены с ног на голову.
Проблема, однако, в том, что вы не знаете, что это перевернуто, если вы используете вывод hOCR, как нигде в документе сказано.
Так как это обнаружить?
1 ответ
После двойной проверки я заметил, что на самом деле он не находится непосредственно в выводе hOCR, я ожидаю некоторый атрибут в ocr_page
div
обозначает ориентацию.
Что я понял, так это то, что вы можете прочитать значения y ограничительной рамки всех ocr_carea
с на страницу:
- Если значения переходят от низкого к высокому, то страница находится в нормальной ориентации.
- Если значения меняются от высокого к низкому, то страница перевернута.
Это может или не может работать для поворота на 90 и 270 градусов, но вполне может быть, что вы видите похожий шаблон для значения x.