Elastisearch-Hadoop, как выполнить массовый поиск в программе Spark

Question

Elastisearch-Hadoop, как выполнить массовый поиск в программе Spark

Я пишу искровую программу, которая в основном представляет собой RDD of Strings. Что мне нужно сделать, это в основном создать запрос на строку и сделать запрос на основе эластичного поискового индекса. Так что, по сути, запрос будет отличаться по строке. Я хотел использовать asticsearch-hadoop для поиска, чтобы иметь возможность оптимизировать. СДР может быть большим, и я ищу любую возможную оптимизацию

Например, RDD - это List[Индия, компания IBM, Netflix, Lebron James]. Мы создадим Больше похожий на этот поиск по всем этим терминам и сделаем поиск по Index Wikipedia и вернем результаты. Например, мы создадим еще четыре подобных запроса для Индии, IBM, Netflix и Lebron James и вернем им хиты.

У меня действительно есть работа, где я могу использовать HTTP Rest Api call с Bulk search, чтобы вернуть хиты, но там я буду делать оптимизацию самостоятельно. Я хотел посмотреть, сможем ли мы использовать упругий коннектор для создания запросов и оптимизировать поиск.

3

apache-spark elasticsearch hadoop elasticsearch-hadoop

Источник

user5745183 07 сен '17 в 02:18

1 ответ

Другие вопросы по тегам apache-spark elasticsearch hadoop elasticsearch-hadoop

user5745183 27 сен '17 в 02:44 2017-09-27 02:44 · Answer 1 · 2017-09-27 02:44

Этот вариант использования невозможен. Эластичный поиск в основном предполагает один или несколько запросов, но не работает с режимом пакетного запроса n=

0

Источник

user5745183 27 сен '17 в 02:44