Какие методы согласования данных доступны для проверки потоков Debezium CDC?

Question

Какие методы согласования данных доступны для проверки потоков Debezium CDC?

Я пытался найти онлайн-документацию или блоги о подходах к проверке полноты сквозного сбора CDC, также известной как «согласование данных». В моей компании мы используем как Debezium для PG, так и Mongo для захвата потоков изменений и их репликации в нашу DWH Snowflake через Kafka. Существуют ли специальные методы, позволяющие убедиться, что WAL или оплог на 100 % соответствуют захваченным событиям? Может быть, выставляя примитивы для операций подсчета / контрольной суммы WAL / oplog в качестве полей метрик / метаданных для сравнения с подсчетами событий изменения? Хотя есть несколько предложений, которые призваны помочь в этом (например , BryteFlow, Redgate), мне любопытно узнать, существуют ли специальные или открытые подходы к этой проблеме, и есть ли какие-либо онлайн-ресурсы, которые я мог пропустить.

Кроме того, я очень удивлен, что это больше обсуждается в блогах и в Интернете, учитывая, насколько важно иметь уверенность в потоках репликации. У меня был только ограниченный успех, я нашел только следующие ресурсы:

4

apache-kafka checksum debezium cdc database-reconciliation

Источник

user527333 11 апр '22 в 14:23

0 ответов

Другие вопросы по тегам apache-kafka checksum debezium cdc database-reconciliation