Сравнение изображений с использованием CBIR и OCR
Работа над проектом для извлечения контента из заданного изображения и сравнения с другими изображениями в хранилище и перечисления соответствующих изображений.
какой подход должен быть правильным, чтобы поиск не замедлялся со временем.
В качестве первого уровня фильтрации я планировал использовать любой запрос изображений (метод CBIR) для извлечения изображений, соответствующих шаблону данного изображения. Затем выполните оптическое распознавание текста, чтобы получить содержимое изображения, и проверьте соответствие.
Пожалуйста, дайте мне знать, есть ли лучший подход к этому.
1 ответ
Шаги сделаны
Программное обеспечение 1. Tesseract OCR 2. Image Magick - Для очистки изображения 3. Сценарий Textcleaner
Определить ориентацию изображения с помощью программного обеспечения Image Magick
- Пакет Convert имеет функцию для определения ориентации изображения с использованием данных EXIF, что не очень полезно.
- Для этого изображения трижды поворачивали на 90 градусов, и данные ocr для каждого сравнивали с другим, чтобы найти правильную ориентацию. (изображение с максимальным количеством слов выигрывает)
OCRed изображение, чтобы получить текст и применить фильтрацию, чтобы получить номер счета, дату и сумму.
- в случае успеха хранит детали в БД для дальнейшего поиска
- в случае неудачи
- Создано 10 разных изображений с разными фильтрами (с использованием серой шкалы и резкости)
- OCRed все изображения и выяснил необходимые данные из всех полученных данных.
Сохраненные данные используются для будущей функции поиска для устранения дублирования