Описание тега google-cloud-dataprep

Интеллектуальная облачная служба данных для визуального изучения, очистки и подготовки данных для анализа.

DataPrep (или, точнее, Cloud Dataprep от Trifacta) - это инструмент визуального преобразования данных, созданный Trifacta и предлагаемый как часть Google Cloud Platform.

Он может принимать и записывать данные в несколько других сервисов Google (BigQuery, Cloud Storage).

Данные преобразуются с использованием рецептов, которые отображаются вместе с визуальным представлением данных. Это позволяет пользователю предварительно просматривать изменения, столбцы профиля и выявлять выбросы и несоответствия типов.

Когда поток DataPrep запускается (вручную или по расписанию), создается задание DataFlow для выполнения задачи. DataFlow - это управляемый Google сервис Apache Beam.