Как удалить дубликаты данных из hbase
У меня есть таблица Hbase.
Схема таблицы: empid, empname,age
Данные 1: Ключ - 1001 Значение - 1, Джон,26 (правильные данные)
Данные 2: Ключ - 1002 Значение - 1, Джон,25 (Неверные данные. По ошибке введены пользователем.)
Здесь только два столбца имеют одинаковые значения, которые empid, empname. Я хочу получить те записи, которые имеют одинаковое значение для всех столбцов, кроме одного значения столбца отличается.
Примечание: может быть возможно, что 3 столбца имеют одинаковое значение, но четвертый имеет другое значение.
Было бы хорошо, если бы вы могли дать мне запрос Impala.