Как удалить дубликаты данных из hbase

У меня есть таблица Hbase.

Схема таблицы: empid, empname,age

Данные 1: Ключ - 1001 Значение - 1, Джон,26 (правильные данные)

Данные 2: Ключ - 1002 Значение - 1, Джон,25 (Неверные данные. По ошибке введены пользователем.)

Здесь только два столбца имеют одинаковые значения, которые empid, empname. Я хочу получить те записи, которые имеют одинаковое значение для всех столбцов, кроме одного значения столбца отличается.

Примечание: может быть возможно, что 3 столбца имеют одинаковое значение, но четвертый имеет другое значение.

Было бы хорошо, если бы вы могли дать мне запрос Impala.

0 ответов

Другие вопросы по тегам