Должен ли я использовать конкатенацию моих строковых полей в качестве хеш-кода?

У меня есть класс Address в C#, который выглядит так:

public class Address
{            
    public string StreetAddress { get; set; }
    public string RuralRoute { get; set; }
    public string City { get; set; }
    public string Province { get; set; }
    public string Country { get; set; }
    public string PostalCode { get; set; }
}

Я реализую равенство и поэтому мне нужно переопределить хэш-код. Сначала я собирался использовать формулу хэш-кода из EJ, но потом подумал: это все строковые поля, не могу ли я просто использовать StringBuilder для их объединения и возврата хеш-кода из этой строки?

То есть:

var str = new StringBuilder();
str.Append(StreetAddress)
   .Append(RuralRoute)
   ...

return str.ToString().GetHashCode();

Каковы преимущества / недостатки этого? Почему я не должен это делать?

4 ответа

Решение

Я бы избегал делать это просто на том основании, что это создает бессмысленную кучу строк - хотя пункт Kosi2801 о том, как сделать столкновения простыми, также актуален. (Я подозреваю, что это на самом деле не создаст много коллизий из-за природы полей, но...)

Я бы выбрал "простой и легкий для получения правильного" алгоритм, который я ранее использовал в этом ответе (спасибо, что нашел его), и который указан в Effective Java, как вы сказали. В этом случае это закончится как:

public int GetHashCode()
{
    int hash = 17;
    // Suitable nullity checks etc, of course :)
    hash = hash * 23 + StreetAddress.GetHashCode();
    hash = hash * 23 + RuralRoute.GetHashCode();
    hash = hash * 23 + City.GetHashCode();
    hash = hash * 23 + Province.GetHashCode();
    hash = hash * 23 + Country.GetHashCode();
    hash = hash * 23 + PostalCode.GetHashCode();
    return hash;
}

Конечно, это не безопасно. Если вы используете C# 3, вы можете рассмотреть метод расширения:

public static int GetNullSafeHashCode<T>(this T value) where T : class
{
    return value == null ? 1 : value.GetHashCode();
}

Тогда вы можете использовать:

public int GetHashCode()
{
    int hash = 17;
    // Suitable nullity checks etc, of course :)
    hash = hash * 23 + StreetAddress.GetNullSafeHashCode();
    hash = hash * 23 + RuralRoute.GetNullSafeHashCode();
    hash = hash * 23 + City.GetNullSafeHashCode();
    hash = hash * 23 + Province.GetNullSafeHashCode();
    hash = hash * 23 + Country.GetNullSafeHashCode();
    hash = hash * 23 + PostalCode.GetNullSafeHashCode();
    return hash;
}

Вы можете создать утилиту метода массива параметров, чтобы сделать это еще проще:

public static int GetHashCode(params object[] values)
{
    int hash = 17;
    foreach (object value in values)
    {
        hash = hash * 23 + value.GetNullSafeHashCode();
    }
    return hash;
}

и назовите это с:

public int GetHashCode()
{
    return HashHelpers.GetHashCode(StreetAddress, RuralRoute, City,
                                   Province, Country, PostalCode);
}

В большинстве типов задействованы примитивы, поэтому в некоторых случаях выполнять упаковку излишне, но в этом случае у вас будут только ссылки. Конечно, вы в конечном итоге создадите массив без необходимости, но вы знаете, что они говорят о преждевременной оптимизации...

Не делайте этого, потому что объекты могут отличаться, хотя хеш-код один и тот же.

Думать о

"StreetAddress" + "RuralRoute" + "City"

против

"Street" + "AddressRural" + "RouteCity"

Оба будут иметь одинаковый хэш-код, но разный контент в полях.

Для такого рода вещей, вы можете реализовать IEqualityComparer<Address>:

public class Address : IEqualityComparer<Address>
{        
    //
    // member declarations
    //

    bool IEqualityComparer<Address>.Equals(Address x, Address y)
    {
        // implementation here
    }

    int IEqualityComparer<Address>.GetHashCode(Item obj)
    {
        // implementation here
    }
}

Вы также можете реализовать IComparable<Address> чтобы получить заказ...

public string getfourDigitEncryptedText(string input) { 
    int hashCode = input.hashCode(); 
    string hstring = (new StringBuilder()).append(hashCode).append("").toString(); 
    string rev_hstring = (new StringBuilder(hstring)).reverse().toString(); 
    string parts[] = rev_hstring.trim().split(""); 
    int prefixint = 0; 
    for(int i = 1; i <= parts.length - 3; i++) 
        prefixint += integer.parseInt(parts[i]);   
    string prefixstr = "0"; 
    if((new integer(prefixint)).toString().length() < 2) 
        prefixstr = (new StringBuilder()).append((new integer(prefixint)).toString()).append("5").toString(); 
    else if((new integer(prefixint)).toString().length() > 2) 
        prefixstr = "79"; 
    else 
        prefixstr = (new integer(prefixint)).toString(); 
    string finalstr = (new StringBuilder()).append(prefixint).append(rev_hstring.substring(3, 5)).toString();
    return finalstr; 
}  
Другие вопросы по тегам