Удалить дубликаты из DataTable и пользовательского IEqualityComparer<DataRow>
Как мне реализовать IEqualityComparer<DataRow>
удалить дубликаты строк из DataTable
со следующей структурой:
ID primary key, col_1, col_2, col_3, col_4
Компаратор по умолчанию не работает, потому что каждая строка имеет свой уникальный первичный ключ.
Как реализовать IEqualityComparer<DataRow>
это пропустит первичный ключ и сравнит только оставшиеся данные.
У меня есть что-то вроде этого:
public class DataRowComparer : IEqualityComparer<DataRow>
{
public bool Equals(DataRow x, DataRow y)
{
return
x.ItemArray.Except(new object[] { x[x.Table.PrimaryKey[0].ColumnName] }) ==
y.ItemArray.Except(new object[] { y[y.Table.PrimaryKey[0].ColumnName] });
}
public int GetHashCode(DataRow obj)
{
return obj.ToString().GetHashCode();
}
}
а также
public static DataTable RemoveDuplicates(this DataTable table)
{
return
(table.Rows.Count > 0) ?
table.AsEnumerable().Distinct(new DataRowComparer()).CopyToDataTable() :
table;
}
но звонит только GetHashCode()
и не звонит Equals()
1 ответ
Решение
Это путь Distinct
работает. Интенсивно он использует GetHashCode
метод. Вы можете написать GetHashCode
делать то, что вам нужно. Что-то вроде
public int GetHashCode(DataRow obj)
{
var values = obj.ItemArray.Except(new object[] { obj[obj.Table.PrimaryKey[0].ColumnName] });
int hash = 0;
foreach (var value in values)
{
hash = (hash * 397) ^ value.GetHashCode();
}
return hash;
}
Поскольку вы знаете свои данные лучше, вы, вероятно, можете придумать лучший способ создания хэша.