Удалить дубликаты из DataTable и пользовательского IEqualityComparer<DataRow>

Как мне реализовать IEqualityComparer<DataRow> удалить дубликаты строк из DataTable со следующей структурой:

ID primary key, col_1, col_2, col_3, col_4

Компаратор по умолчанию не работает, потому что каждая строка имеет свой уникальный первичный ключ.

Как реализовать IEqualityComparer<DataRow> это пропустит первичный ключ и сравнит только оставшиеся данные.

У меня есть что-то вроде этого:

public class DataRowComparer : IEqualityComparer<DataRow>
{
 public bool Equals(DataRow x, DataRow y)
 {
  return
   x.ItemArray.Except(new object[] { x[x.Table.PrimaryKey[0].ColumnName] }) ==
   y.ItemArray.Except(new object[] { y[y.Table.PrimaryKey[0].ColumnName] });
 }

 public int GetHashCode(DataRow obj)
 {
  return obj.ToString().GetHashCode();
 }
}

а также

public static DataTable RemoveDuplicates(this DataTable table)
{
  return
    (table.Rows.Count > 0) ?
  table.AsEnumerable().Distinct(new DataRowComparer()).CopyToDataTable() :
  table;
}

но звонит только GetHashCode() и не звонит Equals()

1 ответ

Решение

Это путь Distinct работает. Интенсивно он использует GetHashCode метод. Вы можете написать GetHashCode делать то, что вам нужно. Что-то вроде

public int GetHashCode(DataRow obj)
{
    var values = obj.ItemArray.Except(new object[] { obj[obj.Table.PrimaryKey[0].ColumnName] });
    int hash = 0;
    foreach (var value in values)
    {
        hash = (hash * 397) ^ value.GetHashCode();
    }
    return hash;
}

Поскольку вы знаете свои данные лучше, вы, вероятно, можете придумать лучший способ создания хэша.

Другие вопросы по тегам