Существуют ли обстоятельства, при которых алгоритм хеширования может быть гарантированно уникальным?

Question

Существуют ли обстоятельства, при которых алгоритм хеширования может быть гарантированно уникальным?

Если я хэширую аналогичные данные с ограниченным размером (например, номера социального страхования) с использованием алгоритма хеширования с большим размером байта, чем у данных (например, sha-256), хеш будет гарантировать тот же уровень уникальности, что и исходные данные?

12

hash unique sha256 hash-code-uniqueness

Источник

user277357 19 фев '10 в 21:50

5 ответов

Другие вопросы по тегам hash unique sha256 hash-code-uniqueness

user271353 19 фев '10 в 22:36 2010-02-19 22:36 · Answer 1 · 2010-02-19 22:36

Вероятность коллизии хеша не имеет никакого отношения к размеру входной строки (за исключением того, что она указывает, сколько входных данных вам необходимо для сохранения уникальности). Возможно хэширование, когда вы хэшируете 0 и 1, используя идеальный алгоритм хэширования, хотя возможна 1/(2^ длина бита). Что в случае с SHA-256 фактически равно нулю.

Хеш-коллизии - проблема парадокса дня рождения. В случае 256-битного хэша вероятность коллизии между двумя входами зависит исключительно от количества входов и составляет:

1 - (2 ^ 256)! / ((2 ^ 256 ^ inputcount) * (2 ^ 256-inputcount)!) Или, как говорили другие - в основном ноль для разумного количества входов.

user10661 19 фев '10 в 22:01 2010-02-19 22:01 · Answer 2 · 2010-02-19 22:01

Вы всегда можете создать индивидуальный хеш, который гарантирует уникальность. Для данных в известном домене (например, SSN) упражнение относительно простое.

Если целевое хеш-значение на самом деле имеет больше доступных битов, чем то, что вы хешируете, хеш просто отображает входные значения в одно из доступных выходных значений. Это будет простое линейное отображение входного значения в виде многобайтового целого на выход в виде многобайтового целого.

Когда целевое хеш-значение имеет меньше битов, чем хешируется, уникальность никогда не может быть гарантирована.

user254279 22 фев '10 в 02:44 2010-02-22 02:44 · Answer 3 · 2010-02-22 02:44

Другие отмечали, что столкновения не должны вызывать беспокойства; в этом весь смысл криптографически безопасных хеш-функций. Я просто хотел бы добавить следующее:

Если ваш входной набор достаточно мал (например, данные представляют собой SSN - их меньше миллиарда), то отсутствие коллизий поддается проверке: просто протестируйте их полностью.
Если входной набор слишком велик для исчерпывающего сканирования, то ожидается, что отсутствие коллизии не может быть доказано. Ожидается, что хорошие хеш-функции будут действовать как случайные оракулы, и на случайном оракуле вы не сможете доказать такое свойство без исчерпывающих попыток. Возможность доказать отсутствие столкновения подозрительно выглядит как слабость функции.

user40756 19 фев '10 в 21:53 2010-02-19 21:53 · Answer 4 · 2010-02-19 21:53

Если вы используете криптографический хеш, такой как SHA, тогда короткий ответ - да.

1

Источник

user40756 19 фев '10 в 21:53

user219985 19 фев '10 в 22:29 2010-02-19 22:29 · Answer 5 · 2010-02-19 22:29

Одна из ключевых особенностей криптографически защищенной хеш-функции заключается в том, что вы защищены от коллизий вне всякого сомнения, независимо от ввода. Это также справедливо для входных данных, которые короче, чем размер выходных данных, что аналогично длинному сообщению с небольшой энтропией. Таким образом, вы можете использовать SHA-2, не беспокоясь о столкновениях.