Разделение данных при записи в дельта-приемник
В потоке данных сопоставления Azure теперь есть возможность сохранять файлы в дельта-формате. Но это доступно только при выборе встроенного набора данных (без подписки на блоки данных). И когда набор данных приемника является встроенным набором данных, он не позволяет установить раздел на основе какого-либо столбца.
Я могу написать код pyspark, чтобы переписать дельта-таблицу с требуемым разделом. Но это повлечет за собой дополнительные расходы.
Что можно было бы обойти, чтобы получить хорошую производительность на дельта-данных?
1 ответ
Была проблема с пользовательским интерфейсом, которая была недавно исправлена группой инженеров. Пока это не отразится на вашем конце.
В качестве обходного пути вы можете сделать следующее:
Опция 1 :
Вы можете изменить тип приемника на другой, например, на приемник текста с разделителями, и тогда вы должны увидеть ключевые столбцы в разделе «Разделение ключей». Затем снова переключите тип Sink на Delta.
Ссылка: https://docs.microsoft.com/en-us/answers/questions/599075/index.html
Вариант 2: вы можете включить разбиение на исходном конце.
Разделенные данные текли потоком. В результате мне удалось получить разделенные данные