Извлечение области текста путем нахождения координат текста из изображения
Я разрабатываю программное обеспечение для обработки изображений, которое извлекает / обрезает и улучшает эту обрезанную одностраничную форму из изображения, полученного с камеры мобильного телефона. Форма не имеет прямоугольных границ, чтобы упростить процесс извлечения. Да, это белый текстовый формат черного фона, но Ничего кроме этого не исправлено. Теперь будет присутствовать некоторый текст, который проверит, что изображение имеет требуемую форму. Таковы мои вопросы.
1) Могу ли я искать определенное регулярное выражение, используя саму библиотеку leptonica, или мне нужно сместить фокус на другие библиотеки, такие как tessarect API, чтобы сделать это. До сих пор я не нашел ничего подобного
2) Теперь предположим, что я знаю текст в верхнем левом углу и нижнем правом углу и успешно его ищу. Могу ли я получить координаты конкретного текста, который я ищу, и затем соответствующим образом обрезать изображение?
1 ответ
Лептоника ничего не делает с текстом, это библиотека обработки изображений.
Чтобы включить получение позиции текста, добавьте tessedit_create_hocr 1
вам файл конфигурации Tesseract (или установите эту опцию в зависимости от способа настройки Tesseract, если вы используете его в качестве библиотеки).
Результатом является уже не текстовый файл, а HTML-файл в кодировке UTF-8 (примечание: это недопустимый XML). Его формат не требует пояснений. Он будет содержать позиции и размеры всех слов на всех страницах в пикселях, как показано на входном изображении. Вам нужно проанализировать этот HTML-код, найти слова, которые вы ищете, а затем получить ограниченную коробку этих слов.