Сравнение изображений с использованием CBIR и OCR

Question

Сравнение изображений с использованием CBIR и OCR

Работа над проектом для извлечения контента из заданного изображения и сравнения с другими изображениями в хранилище и перечисления соответствующих изображений.

какой подход должен быть правильным, чтобы поиск не замедлялся со временем.

В качестве первого уровня фильтрации я планировал использовать любой запрос изображений (метод CBIR) для извлечения изображений, соответствующих шаблону данного изображения. Затем выполните оптическое распознавание текста, чтобы получить содержимое изображения, и проверьте соответствие.

Пожалуйста, дайте мне знать, есть ли лучший подход к этому.

1

ocr cbir

Источник

user1101313 31 авг '15 в 05:01

1 ответ

Решение

Другие вопросы по тегам ocr cbir

user1101313 08 окт '15 в 14:13 2015-10-08 14:13 · Accepted Answer · 2015-10-08 14:13

Шаги сделаны

Программное обеспечение 1. Tesseract OCR 2. Image Magick - Для очистки изображения 3. Сценарий Textcleaner

Определить ориентацию изображения с помощью программного обеспечения Image Magick
- Пакет Convert имеет функцию для определения ориентации изображения с использованием данных EXIF, что не очень полезно.
- Для этого изображения трижды поворачивали на 90 градусов, и данные ocr для каждого сравнивали с другим, чтобы найти правильную ориентацию. (изображение с максимальным количеством слов выигрывает)
OCRed изображение, чтобы получить текст и применить фильтрацию, чтобы получить номер счета, дату и сумму.
- в случае успеха хранит детали в БД для дальнейшего поиска
- в случае неудачи
  - Создано 10 разных изображений с разными фильтрами (с использованием серой шкалы и резкости)
  - OCRed все изображения и выяснил необходимые данные из всех полученных данных.
Сохраненные данные используются для будущей функции поиска для устранения дублирования