Хэш-функция, которая отображает аналогичные входы на аналогичные выходы

Question

Хэш-функция, которая отображает аналогичные входы на аналогичные выходы

Существует ли хэш-функция, в которой небольшие изменения во входных данных приводят к небольшим изменениям в выходных данных? Например, что-то вроде:

hash("Foo") => 9e107d9d372bb6826bd81d3542a419d6
hash("Foo!") => 9e107d9d372bb6826bd81d3542a419d7 <- note small difference

5

algorithm hash hashcode simhash

Источник

user85 06 ноя '09 в 11:35

4 ответа

Другие вопросы по тегам algorithm hash hashcode simhash

user97141 06 ноя '09 в 17:55 2009-11-06 17:55 · Answer 1 · 2009-11-06 17:55

Я бы порекомендовал simhash, алгоритм Марка Манасса.

4

Источник

user97141 06 ноя '09 в 17:55

user158825 06 ноя '09 в 15:35 2009-11-06 15:35 · Answer 2 · 2009-11-06 15:35

Я бы не назвал это хэшем, потому что точка хэша с точностью до наоборот. Однако, с вашей заявленной целью небольших изменений во входных данных, приводящих к небольшим изменениям в выходных данных, я бы посмотрел на использование либо функции soundex, либо алгоритма Ratcliff.

user15416 06 ноя '09 в 12:18 2009-11-06 12:18 · Answer 3 · 2009-11-06 12:18

Тривиальным решением было бы XOR для всех байтов модуля NEg для 64-битного хэша, вы бы XOR (input[0] ^ input[8] ^ input[16]) + 256*(input[1] ^ input[9] ] ^ input[17]) и т. д. Итак, "Foo" хэширует "Foo \ 0 \ 0 \ 0 \ 0 \ 0" и "Foo!" хеширует "Foo!\0\0\0\0".

0

Источник

user15416 06 ноя '09 в 12:18

user1927108 28 апр '16 в 11:40 2016-04-28 11:40 · Answer 4 · 2016-04-28 11:40

Локальное хеширование (LSH) уменьшает размерность многомерных данных. LSH хэширует входные элементы, так что подобные элементы с большой вероятностью отображаются на одни и те же "корзины":

https://en.wikipedia.org/wiki/Locality-sensitive_hashing

Также смотрите: https://en.wikipedia.org/wiki/Perceptual_hashing

Вот хороший пример перцептивного хэширования последовательностей ДНК:

http://arxiv.org/pdf/1412.5517.pdf