Описание тега elasticsearch-bulk-api

По вопросам о массовом API Elasticsearch.
1 ответ

Обновить вложенное поле для миллионов документов

Я использую массовое обновление со скриптом, чтобы обновить вложенное поле, но это очень медленно: POST index/type/_bulk {"update":{"_id":"1"}} {"script"{"inline":"ctx._source.nestedfield.add(params.nestedfield)","params":{"nestedfield":{"field1":"1…
18 окт '17 в 15:11
2 ответа

Elasticsearch: обработка ошибок массового запроса

Я использую Elasticsearch Массовый API для отправки большого количества документов для индексации и удаления сразу. Если для одного документа произошла ошибка, другие документы будут успешно проиндексированы или удалены. И это приводит к неправильно…
0 ответов

Исключения закрытых каналов при закрытии транспортного клиента и массового процессора в asticsearch

У меня есть приложение Java SE, которое использует транспортный клиент и высокоуровневый клиент отдыха для индексации данных в asticsearch, я использую массовый процессор для массовой обработки запросов (индексации, удаления, обновления), например p…
1 ответ

Индексные файлы json навалом эластичный поиск 5.6

У меня есть папка около 590,035 json файлы. Каждый файл - это документ, который необходимо проиндексировать. Если я индексирую каждый документ с использованием Python, то это занимает более 30 часов. Как быстро проиндексировать эти документы? Примеч…
1 ответ

Ошибка API-интерфейса Elasticsearch

У меня проблемы с индексацией в массовом API ES. Это продолжает давать мне эту ошибку: { "error": "JsonParseException[Unexpected character (',' (code 44)): expected a valid value (number, String, array, object, 'true', 'false' or 'null')\n at [Sourc…
0 ответов

Передайте JSON Array в ELasticSearch Bulk API

Я пытаюсь использовать массовый API Elasticsearch для удаления, создания и обновления нескольких документов одновременно. Структура моего документа json в asticsearch выглядит следующим образом { "_index": "pavan-test", "_type": "doc", "_id": "4oEWA…
1 ответ

Elasticsearch-py объемный помощник эквивалент curl с файлом

Я ищу, чтобы повторить следующую команду с помощью Python-клиента asticsearch (и без использования subprocess): curl -s -XPOST "localhost:9200/index_name/_bulk" --data-binary @file Я попытался использовать основной помощник без какой-либо удачи: es …
1 ответ

Как заставить NEST НЕ заполнять запрос в ответе Bulk API?

Я искал повсюду и не смог найти подходящий ответ на этот вопрос. Я создал NEST-клиент, используя этот код: var myIndex = "myTestIndex"; var myType = "myTestType"; var myClusterUri= "http://localhost:9200"; var uri = new Uri(myClusterUri); var settin…
16 июн '16 в 17:43
2 ответа

Elasticsearch - массовая вставка с использованием Sense Web Plugin в Windows

Я пытаюсь импортировать данные account.json, используя _bulk api в соответствии с руководством по упругому поиску ( https://www.elastic.co/guide/en/kibana/current/getting-started.html). Я использую плагин Sense от Google-Chrome для этой задачи. Когд…
1 ответ

ElasticSearch, использование Wildcard для имен индексов при использовании массового API

Я использую плагин RabbitMQ River для Elasticsearch для вставки / удаления данных в наши индексы ElasticSearch. Плагин River поддерживает только Bulk API. Наши текущие данные используют несколько индексов, индекс по дате, что-то вроде "indexName_yyy…
19 янв '15 в 10:18
1 ответ

Установка времени жизни (TTL) из Java - запрашиваемый образец

РЕДАКТИРОВАТЬ: Это в основном то, что я хочу сделать, только на Java Используя ElasticSearch, мы добавляем документы в индекс, минуя элементы IndexRequest, в BulkRequestBuilder. Я хотел бы, чтобы документы были удалены из индекса по прошествии некот…
27 фев '14 в 08:38
2 ответа

Эластичный поиск Python объем API (эластичный поиск Py)

Я не совсем понимаю, как работает решение py -asticsearch для массовых @Diolor https://stackru.com/questions/20288770/how-to-use-bulk-api-to-store-the-keywords-in-es-by-using -python, но я хотел бы использовать простой es.bulk() Мой код: from elasti…
0 ответов

Индексирование "больших" (>40 МБ) документов в Elasticsearch

Я пытаюсь добавить документ 43Mb в индекс в Elasticsearch. Я использую массовый API в Python. Вот фрагмент моего кода: from elasticsearch import helpers from elasticsearch import Elasticsearch document = <read a 43Mb json file, with two fields&gt…
1 ответ

Добавление партий в хранилище эластичного поиска с массовым API

У меня есть огромный набор документов с тем же индексом и тем же типом, но явно разными идентификаторами. Я хочу либо обновить существующие, либо вставить новые в пакетном режиме. Как я могу добиться этого с помощью API массовой индексации? Я хочу с…
1 ответ

Как вставить уже созданную строку в формате json в Elasticsearch Bulk

В скрипте Python, Я пытаюсь для asticsearch.helpers.bulk для хранения нескольких записей. Я получу строку в формате json из другого программного обеспечения и хочу прикрепить ее в исходной части Я получил формат helpers.bulk по этому ответу часть мо…
1 ответ

Почтовый запрос для массового API дает код состояния 406. Как его решить?

Я использую Elastic search 6.1 version Мои данные добавляются правильно, и я добавляю '\n' в конце запроса. Мой код выглядит следующим образом: def insert_in_bulk(self, filee, rtype): U = urljoin(self.args.host, "/_bulk") body = [] f = open(filee) f…
27 дек '17 в 08:22
1 ответ

Насыпной вкладыш для эластичного гнезда 5.x

Я пытался использовать функцию массовой вставки, но каждый раз, когда я использую ее, отображается какая-то ошибка отображения. Изменилось ли объявление функции массовой вставки с гнезда 1.x на гнездо 5.x, потому что в документации по гнездам 5.x я …
2 ответа

Как массово изменить формат JSON для Elastic Search

У меня есть приведенный ниже формат, и я надеялся выполнить предварительную массовую обработку с использованием эластичного поиска. {"title":"April","url":"https://simple.wikipedia.org/wiki/April", "abstract":"April is the 4th month of the year, and…
17 окт '17 в 16:28
1 ответ

Получить все документы из индекса кластера эластичного поиска и индексировать его в другом кластере эластичного поиска

Моя цель здесь - получить все документы из индекса кластера ES и вставить их в другой кластер ES, сохраняя те же метаданные. Я взглянул на mget API для извлечения данных и Bulk API для их вставки, но этот Bulk API нуждается в специальной структуре: …
1 ответ

Как использовать ttl в эластичном API на Esesearch (NEST)

Я пытаюсь использовать массовый API с помощью клиента NEST. Как я могу указать значение TTL на основе атрибута коллекции. Рассмотрим следующий фрагмент кода, как я могу указать "ttl", чтобы сказать person.Age > 50 -> 1 месяц, иначе 6 месяцев?: var c…
03 дек '14 в 12:10