Оценка Spark-Notebook

Я оцениваю Spark Notebook и нашел три разных продукта; 1. Hue 3.9 поставляется с ноутбуком Spark (бета) 2. Apache zeppelin 3. andypetrella/spark-notebook.

Можете ли вы помочь мне понять плюсы и минусы каждого продукта

Спасибо пани

2 ответа

Я играл только с Хюэ и Юпитером.

Hue является своего рода новым, но предлагает больше, чем просто Spark Notebook, он интегрируется со всеми компонентами Hadoop (Oozie, Solr, Impala, HBase, Pig...).

Jupyter отлично подходит, если вам нужен продвинутый редактор для Pyspark. Редактор Python действительно хорош и очень популярен в сообществе Python.

Jupyter - это хорошо зарекомендовавший себя проект, в то время как Spark Notebook - это отличная, но индивидуальная попытка с довольно недавним объяснением от самого автора, а Zeppelin инкубирует в Apache, так что в этом отношении у нас есть современная версия "никто никогда не был уволен покупка IBM" (пока они не сделали, ха-ха), и Jupyter - IBM в комнате.

Это может помочь просмотреть некоторые документы на Cloudera, например, http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/ (обратите внимание, Jupyter раньше назывался iPython Notebook)

Если бы вы могли больше публиковать информацию о вашем сценарии использования, это помогло бы людям ответить на ваш вопрос и, возможно, опубликовать то, что вы уже провели исследование, Stackru предъявляет особые требования к хорошим вопросам, и большой акцент делается на том, чтобы сначала что-то попробовать, и опубликовать код. Ваш вопрос лучше подходит для другого сайта StackExchange.

Если вы посмотрите здесь, вы получите более интересную информацию, например, о том, что Zeppelin больше сконцентрирован на работе поверх Hadoop (и Tachyon? Который, я думаю, прозрачный слой), а Zeppelin предоставляет подключаемый интерфейс, чтобы вы могли работать с большим количеством языков.

Другие вопросы по тегам