Сравнение лиц по тысячам фотографий
В последние несколько дней я изучал основы распознавания лиц благодаря проекту, над которым я работаю. Через некоторое время сложность этого предмета стала мне понятна. Сначала я использовал базовый класс распознавания лиц PHP на Github, чтобы выяснить, есть ли лицо на обслуживаемом изображении. Это не сработало для меня, так как мне нужно больше, чем просто has_face == TRUE или FALSE.
Куда бы вы ни посмотрели, люди предлагают OpenCV, когда вы действительно хотите иметь возможность распознавать, распознавать и сравнивать лица.
После изучения некоторых примеров OpenCV меня продали. Распознавание (с некоторыми настройками) работает практически идеально.
Единственная проблема в том, что это 50% решение. Поскольку для меня есть две проблемы:
- Надежное распознавание лиц и возможность видеть от 0 до 10 лиц на одном изображении. (Готово)
- Сравнение лиц до 150 000 изображений.
Поэтому я вернулся к OpenCV и документам, чтобы найти магию сравнения лиц. Но проблема в том, что единственное, что я могу найти, - это сравнение двух изображений / лиц. Но я хочу добиться следующего:
Пользователь загрузил 100 000 изображений (предположим, что у каждого из них есть лицо). Между этими изображениями есть 2000 фотографий Кэти Перри, и из этих 2000 изображений я отмечаю одно лицо как: Кэти Перри. Когда я сейчас ищу Кэти Перри, появляется эта конкретная фотография. Но я также хочу "предложить" другие фотографии, из которых очень точно, что Кэти Перри на этой фотографии.
Единственное, чего я добился - это сравнить 2 лица друг с другом. Это прекрасно работает, но с этой тактикой мне нужно будет сделать 100 000 сканирований для каждой фотографии. 100 000 фотографий и 100 000 снимков заняли бы слишком много времени и ресурсов.
Таким образом, вопрос заключается в следующем: есть ли способ добиться сравнения лица на тысячах фотографий.
Чтобы завершить свой вопрос: я нашел несколько способов сделать это с помощью API, как у Microsoft: Подобный поиск лиц с их Face API. Но я действительно хочу достичь этого без использования API и, что более важно, меня очень интересует наука, стоящая за этим.
Надеюсь, кто-то может помочь. заранее спасибо