Апач спарк против акка-кластер
У меня есть сценарий использования, когда я должен прочитать данные из kafka и выполнить несколько этапов обработки (синхронизация и асинхронность) по нему со скоростью 20 кбит / с или более. Я смотрю на Apache spark или акка-кластер с реактивной-кафкой. Оба, кажется, обеспечивают равные возможности для этой цели в масштабе.
Можете ли вы предоставить сильные стороны для каждого из них, и какой из них больше подходит для такого варианта использования, основываясь на характерных особенностях каждого из них.