Google cloud dataprep - как создать хеш столбца
Может ли кто-нибудь указать на готовую или нестандартную реализацию в Cloud Dataprep для создания хэша другого столбца, например, bigquery имеет FARM_FINGERPRINT.
1 ответ
К сожалению, Trifacta, который поддерживает Trifacta, не имеет встроенного хеширования. Их рекомендуется использовать для этой цели пользовательские функции. Cloud Dataprep не поддерживает UDF.
Я бы порекомендовал сделать одно из следующего:
- Хеширование данных перед тем, как вы их проверяете в Dataprep
- Затенение данных другими способами, такими как нечеткое форматирование чисел