Зачем создавать хэш в перцептивном хеше?

Я работал с примерами на http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html&comment-submitted и я застрял, пытаясь создать хеш из битов изображения после его обработки. Если вы хэшируете двоичную строку, созданную из пикселей изображения, а затем смотрите на расстояние Хемминга, чтобы проанализировать, насколько различны фотографии, что хорошего в том, чтобы создать хеш, делающий расстояние Хемминга, и делать расстояние Хемминга на необработанной двоичной строке? Хэш создан только для ускорения процесса?

Я не знаю много о хэшах. Я предполагаю, что в этом случае они действуют как механизм фильтрации для почти идентичных фотографий? Но разве эта фильтрация не достигается путем уменьшения размера фотографии и преобразования ее в оттенки серого?

1 ответ

Решение

Идея, представленная в блоге, заключается в том, как распознать похожие картинки. И цель состоит в том, чтобы потерять правильную информацию, чтобы то, что осталось, было значимым и легко сравниваемым. Таким образом, есть два аспекта: насколько быстро и насколько точно вы можете сравнить. Если вы уменьшите изображение до 8x8 черно-белого (то есть 64 бит информации), то не имеет значения, если вы называете это "сырой строкой прикуса" или "длинным хешем" (ну, как заметил @Blender это не совсем хэш в обычном использовании этого термина). Важно то, как ее уменьшить и какую информацию оставить, а какую потерять.

Другие вопросы по тегам