Глядя на мой собственный формат запроса - я должен реализовать адаптер Clacite против Flink TableSource

Я ищу запрос и использую потоковую обработку для моего собственного формата. хотя я все еще проверяю, стоит ли мне использовать паркет, ORC, Avro или что-то еще, но этот источник демонстративно будет частным.

эти данные должны быть проанализированы с использованием SQL (поток не поток). Флинк отлично подходит для этой работы - я знаю, и он будет использован. я также знаю, что flink использует Calcite для разбора SQL.

Вопрос -

Должен ли я реализовать Адаптер кальцита - который позволит мне работать с использованием простого JDBC, со своими собственными преимуществами, независимо от Flink

или я должен использовать реализовать источник таблицы Flink? я буду демонстративно использовать flink для аналитики - но если я использую реализацию Calcite, я могу использовать JDBC-источник для таблицы Flink и при этом иметь возможность подключаться к стороннему инструменту BI. правильный?

Как вы думаете, какой подход лучше? какой из них проще?

мне нужно будет управлять всем форматом схемы и печатать в обоих случаях.

0 ответов

Другие вопросы по тегам