Сравнение изображений с использованием CBIR и OCR

Работа над проектом для извлечения контента из заданного изображения и сравнения с другими изображениями в хранилище и перечисления соответствующих изображений.

какой подход должен быть правильным, чтобы поиск не замедлялся со временем.

В качестве первого уровня фильтрации я планировал использовать любой запрос изображений (метод CBIR) для извлечения изображений, соответствующих шаблону данного изображения. Затем выполните оптическое распознавание текста, чтобы получить содержимое изображения, и проверьте соответствие.

Пожалуйста, дайте мне знать, есть ли лучший подход к этому.

1 ответ

Решение

Шаги сделаны

Программное обеспечение 1. Tesseract OCR 2. Image Magick - Для очистки изображения 3. Сценарий Textcleaner

  1. Определить ориентацию изображения с помощью программного обеспечения Image Magick

    • Пакет Convert имеет функцию для определения ориентации изображения с использованием данных EXIF, что не очень полезно.
    • Для этого изображения трижды поворачивали на 90 градусов, и данные ocr для каждого сравнивали с другим, чтобы найти правильную ориентацию. (изображение с максимальным количеством слов выигрывает)
  2. OCRed изображение, чтобы получить текст и применить фильтрацию, чтобы получить номер счета, дату и сумму.

    • в случае успеха хранит детали в БД для дальнейшего поиска
    • в случае неудачи
      • Создано 10 разных изображений с разными фильтрами (с использованием серой шкалы и резкости)
      • OCRed все изображения и выяснил необходимые данные из всех полученных данных.
  3. Сохраненные данные используются для будущей функции поиска для устранения дублирования

Другие вопросы по тегам