Apache Spark 2.3.1 - твиттер не является членом пакета org.apache.spark.streaming

Прежде всего, я некоторое время искал эту проблему, и я вижу, что существуют другие решения по этому вопросу, но ничего для Apache Spark версии 2.3.1.

Короче говоря, я пытаюсь создать приложение, которое использует bahir для выполнения аналитических твиттер-сообщений в spark.

Тем не менее, я использую Apache Spark версии 2.3.1, поэтому я нашел 2.3.0-SNAPSHOT

Но когда я пытаюсь использовать это bin/spark-shell --packages org.apache.bahir:spark-streaming-twitter_2.11:2.3.0-SNAPSHOT, это не может быть найдено, от моей местной искры оболочки:

:: USE VERBOSE OR DEBUG MESSAGE LEVEL FOR MORE DETAILS Exception in thread "main" java.lang.RuntimeException: [unresolved dependency: org.apache.bahir#spark-streaming-twitter_2.11;2.3.0-SNAPSHOT: not found]

Я могу быть глупым предположением, но я подумал, что, возможно, 2.3.0 подойдет для 2.3.1.

Я могу получить версию 2.2.1, и twitter4j, кажется, работает, однако у меня все еще возникают проблемы с реальным streaming.twitter_ работать с Spark 2.3.1. Из моей местной искры-оболочки:

scala> import org.apache.spark.streaming.twitter._ <console>:23: error: object twitter is not a member of package org.apache.spark.streaming import org.apache.spark.streaming.twitter._
                                     ^

Было бы интересно узнать, если кто-нибудь знает, можно ли его использовать с Apache Spark 2.3.1?

Или я просто вынужден понизить версию Spark, чтобы она заработала?

Я делаю это в блокноте под названием Zeppelin, но я также пытался сделать это вне Zeppelin, так что, похоже, не имеет ничего общего с ноутбуком, который я использую.

Благодарен за любые идеи.

0 ответов

Я столкнулся с той же проблемой. Я не могу убавить искру, потому что мне нужно 2.3 с другим гелием.. Так что попробую зависимость от bahir

<dependency>
    <groupId>org.apache.bahir</groupId>
    <artifactId>spark-streaming-twitter_2.11</artifactId>
    <version>2.3.0</version>
</dependency>

Я дам вам знать, если это сработает...

Изменить: это сработало.

%spark2.dep
z.reset()
z.addRepo("MavenCentral").url("https://mvnrepository.com/")
z.load("org.apache.bahir:spark-streaming-twitter_2.11:2.3.0")

Он решает проблему с несуществующими новыми библиотеками твиттера, а также решает проблему с отсутствующими классами из "старой искры" в "новой искре".

Я смог запустить примеры сумм, используя карту листовок на javascript и искру 2.3 искры:)

Другие вопросы по тегам