LINQ Отличный оператор, игнорировать регистр?

Приведен следующий простой пример:

    List<string> list = new List<string>() { "One", "Two", "Three", "three", "Four", "Five" };

    CaseInsensitiveComparer ignoreCaseComparer = new CaseInsensitiveComparer();

    var distinctList = list.Distinct(ignoreCaseComparer as IEqualityComparer<string>).ToList();

Похоже, что CaseInsensitiveComparer фактически не используется для сравнения без учета регистра.

Другими словами, DifferentList содержит то же количество элементов, что и список. Вместо этого я ожидаю, например, что "три" и "три" будут считаться равными.

Я что-то упустил или это проблема оператора Distinct?

4 ответа

Решение

StringComparer делает то, что вам нужно:

List<string> list = new List<string>() {
    "One", "Two", "Three", "three", "Four", "Five" };

var distinctList = list.Distinct(
    StringComparer.CurrentCultureIgnoreCase).ToList();

(или инвариант / порядковый / и т.д. в зависимости от данных, которые вы сравниваете)

[См. Ответ Марка Гравелса, если вы хотите самый лаконичный подход]

После некоторых исследований и хороших отзывов от Брэдли Грейнджера я реализовал следующий IEqualityComparer. Он поддерживает регистронезависимый оператор Distinct() (просто передайте его экземпляр оператору Distinct):

class IgnoreCaseComparer : IEqualityComparer<string>
{
    public CaseInsensitiveComparer myComparer;

    public IgnoreCaseComparer()
    {
        myComparer = CaseInsensitiveComparer.DefaultInvariant;
    }

    public IgnoreCaseComparer(CultureInfo myCulture)
    {
        myComparer = new CaseInsensitiveComparer(myCulture);
    }

    #region IEqualityComparer<string> Members

    public bool Equals(string x, string y)
    {
        if (myComparer.Compare(x, y) == 0)
        {
            return true;
        }
        else
        {
            return false;
        }
    }

    public int GetHashCode(string obj)
    {
        return obj.ToLower().GetHashCode();
    }

    #endregion
}

 ## Distinct Operator( Ignoring Case) ##
  string[] countries = {"USA","usa","INDIA","UK","UK" };

  var result = countries.Distinct(StringComparer.OrdinalIgnoreCase);

  foreach (var v in result) 
  { 
  Console.WriteLine(v);
  }

OutPut будет

   USA 
   INDIA
   UK

Вот гораздо более простая версия.

List<string> list = new List<string>() { "One", "Two", "Three", "three", "Four", "Five" };

var z = (from x in list select new { item = x.ToLower()}).Distinct();

z.Dump();
Другие вопросы по тегам