Использовать Flink для обработки сообщений кафки за последние 10 минут?

Мы рассматриваем возможность использования Flink SQL для специальной аналитики данных Кафки в реальном времени за последние 5–10 минут. Похоже, что для этого нам нужно расширить коннектор Kafka, чтобы он мог только читать сообщения за определенный период времени, и использовать его для генерации конечного источника ввода.

Мне интересно, есть ли альтернативный подход к этому. Любые предложения будут очень приветствоваться.

1 ответ

Разъем Flink Kafka позволяет устанавливать начальное положение различными способами, в том числе myConsumer.setStartFromTimestamp(...), Коннектор таблицы Kafka поддерживает эти же параметры.

Если вы хотите использовать SQL-клиент Flink, вам может потребоваться написать тонкую оболочку, которая будет заниматься вычислением отметки времени 10 минут назад и соответственно устанавливает начальное смещение Кафки.

Другие вопросы по тегам