Google cloud dataprep - как создать хеш столбца

Может ли кто-нибудь указать на готовую или нестандартную реализацию в Cloud Dataprep для создания хэша другого столбца, например, bigquery имеет FARM_FINGERPRINT.

1 ответ

К сожалению, Trifacta, который поддерживает Trifacta, не имеет встроенного хеширования. Их рекомендуется использовать для этой цели пользовательские функции. Cloud Dataprep не поддерживает UDF.

Я бы порекомендовал сделать одно из следующего:

  1. Хеширование данных перед тем, как вы их проверяете в Dataprep
  2. Затенение данных другими способами, такими как нечеткое форматирование чисел
Другие вопросы по тегам