NestedQuery в BoolQuery с использованием Java API

Я пытаюсь понять, как работает запрос в EL, если честно, с множеством проблем.

Вот мои документы со свойствами:

{"statusError":null,
"fileHash":"da8620bad21685c5e385fb1b43a7e744",
"project":{"id":7687},
"error":null,
"ocrFile64":"JVBERi0xL...."
"isInElastic":false,
"originalName":"test.pdf",
"lastUpdated":"2018-10-18T12:47:59Z",
"dateCreated":"2018-10-18T12:40:19Z",
"ocrAvailable":true,
"attachment":{"date":"2018-07-05T07:20:06Z",
"content_type":"application/pdf",
"language":"en","title":"Untitled",
"content":"blah blah blahblahblahblahblah"
"company":{"id":1},
"id":25850,
"tag":[{"id":3},{"id":2}],
"contentType":"application/pdf",
"imageHash":"",
"label":null,
"size":47680,
"user":{"id":7563},
"md5":[100,97,56,54,50,48,98,97,100,50,49,54,56,53,99,53,101,51,56,53,102,98,49,98,52,51,97,55,101,55,52,52],
"status":{"name":"CLASSIFIED"}}

EL имеет подключаемый модуль Ingest Module для загрузки содержимого файла. На самом деле конвейер ocrFile64, а содержимое файла находится внутри свойств содержимого.

То, что я пытаюсь сделать, довольно просто, я хотел бы сделать такой запрос: дать мне весь документ, где originalName содержит "test", а user.id равен 1, а контент содержит "blah".

Пока я написал это:

client = new RestHighLevelClient(builder)
SearchRequest searchRequest = new SearchRequest("testEL")
searchRequest.types("test")
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder()
searchSourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS))
BoolQueryBuilder boolQuery = new BoolQueryBuilder();

boolQuery.filter(new MatchPhrasePrefixQueryBuilder("originalName", "test"))

boolQuery.filter(new NestedQueryBuilder("user", new MatchQueryBuilder("user.id", "1"), ScoreMode.None))

boolQuery.filter(new MatchPhrasePrefixQueryBuilder("content", "blah"))

searchSourceBuilder.query(boolQuery)
searchRequest.source(searchSourceBuilder)
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);

Если я запрашиваю только orignalName, это работает. Если я больше не добавляю контент, если я добавляю вложенный запрос, это приводит к ошибке:

org.elasticsearch.ElasticsearchStatusException: Elasticsearch exception [type=search_phase_execution_exception, reason=all shards failed]

Спасибо

Вот отображение:

{
  "mapping": {
    "test": {
      "properties": {
        "attachment": {
          "properties": {
            "content": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "content_length": {
              "type": "long"
            },
            "content_type": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "date": {
              "type": "date"
            },
            "language": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "title": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            }
          }
        },
        "company": {
          "properties": {
            "id": {
              "type": "long"
            }
          }
        },
        "contentType": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "dateCreated": {
          "type": "date"
        },
        "fileHash": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "id": {
          "type": "long"
        },
        "imageHash": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "isClassified": {
          "type": "boolean"
        },
        "isInElastic": {
          "type": "boolean"
        },
        "label": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "lastUpdated": {
          "type": "date"
        },
        "md5": {
          "type": "long"
        },
        "ocrAvailable": {
          "type": "boolean"
        },
        "ocrFile64": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "originalName": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "project": {
          "properties": {
            "id": {
              "type": "long"
            }
          }
        },
        "size": {
          "type": "long"
        },
        "status": {
          "properties": {
            "enumType": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "name": {
              "type": "text",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            }
          }
        },
        "storageName": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "tag": {
          "properties": {
            "id": {
              "type": "long"
            }
          }
        },
        "user": {
          "properties": {
            "id": {
              "type": "long"
            }
          }
        }
      }
    }
  }
}

1 ответ

Решение

Elasticsearch жалуется, потому что ваш "user" поле не является nested поле типа. Вы можете использовать стандарт match или term запрос на "user.id",

Запрос JSON будет выглядеть примерно так:

POST <your_index>/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "originalName": "test"
          }
        },
        {
          "match": {
            "user.id": 1
          }
        },
        {
          "match": {
            "content": "blah"
          }
        }
      ]
    }
  }
}
Другие вопросы по тегам