Категоризация объектов по сходству между ними
У меня есть несколько объектов (это изображения лиц). У меня есть метрика для сравнения одного объекта с другим (библиотека распознавания лиц). Это возвращает простое значение 0-1 для сходства. Все> 0,7 - разумное совпадение.
Я пытаюсь выяснить, как лучше всего разделить список этих объектов на подмассивы, основываясь на том, насколько похож один объект на другой.
Очевидно, что легко начать с первого объекта и создать группу всех похожих объектов. Это теряет пользу от отношений между подобъектами и добавляет проблему наследования ложных срабатываний.
Чем больше я думал об этом, тем больше я думал, что должно быть стандартное решение такой ситуации!!
Есть идеи?
Дополнительным бонусом будет ручное взвешивание впоследствии. Таким образом, если ложное срабатывание включено, можно было бы вручную исключить этот объект и соответственно изменить группировку.
Это все C#, кстати, не то, чтобы это имело большое значение.