Удаление изображений на основе содержимого с использованием библиотеки LIRE, рекомендуемые функции для извлечения из изображений для обнаружения почти дублированных изображений
Я использую библиотеку LIRE ( https://github.com/dermotte/LIRE), которая использует поиск изображений на основе содержимого для обнаружения похожих изображений.
Вся идея состоит в том, чтобы извлечь одну или несколько низкоуровневых функций изображения из каждого изображения в базе данных изображений и проиндексировать эти функции. Затем, когда входит входное изображение, извлекайте по одному объекту за раз и смотрите, насколько близко входное изображение находится к каждому "похожему" изображению в списке изображений, возвращаемых извлеченным объектом.
Для моего случая, когда я даю входное изображение, мне нужны ОЧЕНЬ похожие изображения (точно такие же, < 5% пикселей изменены, яркость изменена и т. Д.).
Ниже приведен пример изображения и то, что я считаю "тем же" изображением.
Образец входного изображения:
Что я считаю одинаковыми изображениями:
Что я считаю другим изображением (при условии, что изображение было одинакового размера):
Я знаю, что этот вопрос не имеет правильного ответа, но какова хорошая комбинация функций для извлечения, которые LIRE поддерживает для получения моего набора целевых изображений, когда я даю ему указанное выше входное изображение?