Двоичное изображение хэширования - сколько байтового массива использовать?
Я хотел бы хэшировать изображения, которые были преобразованы в байтовые массивы. Чем быстрее процесс, тем лучше, поэтому мне было интересно, сколько из байтового массива из 300000 элементов мне действительно нужно передать в хеш-функцию (в данном случае sha1), чтобы получить уникальную хеш-строку? Кто-нибудь знает, если в двоичных файлах изображений первый фрагмент х - это все метаданные? Есть ли магический индекс, который я могу использовать вместо полной длины байтового массива? Ex. только первый хэш [5000].
1 ответ
Мое мнение таково, что это вопрос вероятности наличия уникального хеша для каждого изображения. Если вы используете только первые 5000 байтов изображения размером 300000 байтов, то два изображения, отличающиеся только своей нижней частью, вероятно, будут иметь одинаковый хэш. Это не обязательно вопрос sha1.
Вы также можете распределить свои 5000 байтов равномерно по 300000 байтов.