Цеппелин над Суперсетом
Я использую zeppelin в течение нескольких лет, теперь superset привлекает все больше внимания для улучшения функций визуализации и т. Д., Поэтому я пытаюсь понять точные различия, а также помочь, если кто-то хочет выбрать инструмент BI.
Я перечислил несколько уникальных функций, основанных на начальном чтении суперсета, было бы очень признательно, если бы кто-нибудь мог внести больше в список.
- Поддержка интеграции большинства кластеров больших данных (Spark, flink и т. Д.)
- Выполнение встроенного кода с использованием абзацев
- Поддержка нескольких языков
Поскольку я не являюсь полноценным пользователем суперсета, я хотел бы узнать больше об уникальных функциях Zeppelin, которые невозможно или сложно реализовать в Superset.
Также я получил подробную информацию из apache wiki, но я не думаю, что это может быть уникальным фактором, кроме использования стиля блокнотов.
Apache Zeppelin - косвенный конкурент, но он решает другой вариант использования.
Apache Zeppelin - это веб-блокнот, который обеспечивает интерактивный анализ данных. Он позволяет создавать красивые, основанные на данных, интерактивные и совместные документы с помощью SQL, Scala и других. Хотя пользователь может создавать визуализации данных с помощью этого проекта, он использует пользовательские интерфейсы в стиле записной книжки и ориентирован на сообщество Spark, где сосуществуют Scala и SQL.
1 ответ
По сути, Zeppelin и Superset придерживаются совершенно разных точек зрения на рабочий процесс данных.
В основе Zeppelin лежит [интерфейс вычислительной записной книжки][1], который позволяет вам писать фрагменты кода, запускать их и усваивать вывод, а также выполнять итерацию и расширять. Затем записные книжки Zeppelin сосредотачиваются на работе с 20+ программистами [языками и интерпретаторами][2]. Zeppelin также может запрашивать популярные базы данных с помощью коннектора JDBC.
Superset основан на сценарии использования бизнес-аналитики и поставляется с SQL IDE и построителем диаграмм без кода. Важным отличием здесь является то, что Superset может запрашивать данные только из баз данных, говорящих на языке SQL. Superset, в отличие от Zeppelin, не позволяет запускать произвольный код из множества языков программирования.
Сценарии использования, рабочие процессы и варианты дизайна у обоих этих инструментов сильно различаются. Superset хочет дать возможность конечным пользователям, аналитикам и специалистам по SQL создавать информационные панели (которые могут использоваться другими сотрудниками организации). Zeppelin хочет повысить уровень специалистов по обработке данных и программистов для анализа данных и меньше ориентирован на создание информационных панелей для остальной части организации.
[1]: https://en.wikipedia.org/wiki/Notebook_interface#:~:text=A%20notebook%20interface%20(also%20called,and%20text%20into%20separate%20sections.[2]: https://zeppelin.apache.org/supported_interpreters.html