Таблица дельты как источник потока. Как рассчитать потребительское отставание
Я использую структурированную потоковую передачу apace spark для потоковой передачи данных из дельта-таблицы. Проблема в том, что я не вижу отставания потребителей. Как мы можем рассчитать отставание потребителей?
Я также бросил файлы контрольных точек, созданные для каждой партии, но у них есть только временная метка в эпоху.
.format("delta")
.load("/mnt/delta/events")
.groupBy("customerId")
.count()
.writeStream
.format("delta")
.outputMode("complete")
.option("checkpointLocation", "/mnt/delta/eventsByCustomer/_checkpoints/streaming-agg")
.start("/mnt/delta/eventsByCustomer")