Условия заказа Агрегирование по географическому расстоянию

Так что у меня есть проблема здесь...

я использую chewy рубиновый камень для общения с Elasticsearch

=> #<Chewy::SnippetPagesIndex::Query:0x007f911c6b1610
 @_collection=nil,
 @_fully_qualified_named_aggs={"chewy::snippetpagesindex"=>{"chewy::snippetpagesindex::snippetpage"=>{}}},
 @_indexes=[Chewy::SnippetPagesIndex],
 @_named_aggs={},
 @_request=nil,
 @_response=nil,
 @_results=nil,
 @_types=[],
 @criteria=
  #<Chewy::Query::Criteria:0x007f911c6b1458
   @aggregations=
    {:group_by=>{:terms=>{:field=>"seo_area.suburb.id", :order=>{:_count=>"asc"}}, :aggs=>{:by_top_hit=>{:top_hits=>{:size=>10}}}}},
   @facets={},
   @fields=[],
   @filters=
    [{:geo_distance=>{:distance=>"100km", "seo_area.suburb.coordinates"=>"-27.9836052, 153.3977354"}},
     {:bool=>
       {:must_not=>[{:terms=>{:id=>[1]}}, {:terms=>{"seo_area.suburb.id"=>[5559]}}],
        :must=>[{:term=>{:path_category=>"garden-services"}}, {:term=>{:status=>"active"}}, {:exists=>{:field=>"path_area"}}],
        :should=>[]}}],
   @options=
    {:query_mode=>:must,
     :filter_mode=>:and,
     :post_filter_mode=>:and,
     :preload=>
      {:scope=>
        #<Proc:0x007f911c6b1700@/Users/serviceseeking/Work/serviceseeking/engines/seo/app/concepts/seo/snippet_page/twins/search.rb:45 (lambda)>},
     :loaded_objects=>true},
   @post_filters=[],
   @queries=[],
   @request_options={},
   @scores=[],
   @script_fields={},
   @search_options={},
   @sort=[{:_geo_distance=>{"seo_area.suburb.coordinates"=>"-27.9836052, 153.3977354", :order=>"asc", :unit=>"km"}}],
   @suggest={},
   @types=[]>,
 @options={}>

Я использую агрегацию Elasticsearch, поэтому при доступе к агрегации любая сортировка на этапе запроса / поиска будет исключена.

То, что я проходил, это...

     aggs: {
        by_seo_area_suburb_id: {
          terms: {
            field: "seo_area.suburb.id",
            size: 10,
            order: { by_distance: "desc" }
          },
          aggs: {
            by_top_hit: {
              top_hits: { size: 10 }
            },
            by_distance: {
              geo_distance: {
                field: "seo_area.suburb.coordinates",
                origin: "52.3760, 4.894",
                ranges: [
                  { from: 0, to: 1 },
                  { from: 1, to: 2 }
                ]
              }
            }
          }
        }
      }

Я получаю эту ошибку, хотя...

[500] {"error":{"root_cause":[{"type":"aggregation_execution_exception","reason":"Invalid terms aggregation order path [by_distance]. Terms buckets can only be sorted on a sub-aggregator path that is built out of zero or more single-bucket aggregations within the path and a final single-bucket or a metrics aggregation at the path end."}],"type":"search_phase_execution_exception","reason":"all shards failed","phase":"query","grouped":true,"failed_shards":[{"shard":0,"index":"snippet_pages","node":"srrlBssmSEGsqpZnPnOJmA","reason":{"type":"aggregation_execution_exception","reason":"Invalid terms aggregation order path [by_distance]. Terms buckets can only be sorted on a sub-aggregator path that is built out of zero or more single-bucket aggregations within the path and a final single-bucket or a metrics aggregation at the path end."}}]},"status":500}

Просто говорит...

Сегменты терминов могут быть отсортированы только по пути субагрегатора, который построен из нуля или нескольких агрегаций с одним сегментом в пределах пути и конечного агрегации с одним сегментом или метрики в конце пути.

Есть идеи?

1 ответ

Решение

У вас есть ведра, как это:

1-2

2-3

4-5

и так далее. Это не отдельные корзины с естественным порядком. Вот что говорит вам исключение. Таким образом, вам нужно что-то, чтобы расплавить это до отдельных значений.

Даже если бы вы могли заказать этим. Почему ты? Все с расстоянием от 1 до 2 будут иметь одинаковое значение для сравнения, и их порядок будет неопределенным. Если вам достаточно знать, какие 0-1 и 1-2 и т. Д., Просто измените порядок агрегирования. Сначала возьмите расстояние и сделайте подгруппу для терминов.

В общем, я думаю, что у вас есть сценарий использования, в котором агрегаты не являются тем, что вы хотите, потому что рассмотрите следующие два документа:

{ name: "peter", location: [0,0] }
{ name: "peter", location: [100,0] }

Очевидно, что оба Питера слились бы в единое целое. Но у них есть два разных местоположения, и поэтому расстояние (почти) всегда будет разным. Так как же вы можете заказать петерс по расстоянию? Как только вы агрегируете поле, все остальные поля более или менее отделяются от него, и вы не можете использовать другие поля для этого.

Так. Если вы хотите что-то подобное, вам, скорее всего, придется пройти обычный поиск. Посмотрите на это, как отсортировать поиск по расстоянию:

https://www.elastic.co/guide/en/elasticsearch/guide/current/sorting-by-distance.html

Другие вопросы по тегам