Описание тега google-cloud-dataprep
Интеллектуальная облачная служба данных для визуального изучения, очистки и подготовки данных для анализа.
DataPrep (или, точнее, Cloud Dataprep от Trifacta) - это инструмент визуального преобразования данных, созданный Trifacta и предлагаемый как часть Google Cloud Platform.
Он может принимать и записывать данные в несколько других сервисов Google (BigQuery, Cloud Storage).
Данные преобразуются с использованием рецептов, которые отображаются вместе с визуальным представлением данных. Это позволяет пользователю предварительно просматривать изменения, столбцы профиля и выявлять выбросы и несоответствия типов.
Когда поток DataPrep запускается (вручную или по расписанию), создается задание DataFlow для выполнения задачи. DataFlow - это управляемый Google сервис Apache Beam.