Условия заказа Агрегирование по географическому расстоянию
Так что у меня есть проблема здесь...
я использую chewy
рубиновый камень для общения с Elasticsearch
=> #<Chewy::SnippetPagesIndex::Query:0x007f911c6b1610
@_collection=nil,
@_fully_qualified_named_aggs={"chewy::snippetpagesindex"=>{"chewy::snippetpagesindex::snippetpage"=>{}}},
@_indexes=[Chewy::SnippetPagesIndex],
@_named_aggs={},
@_request=nil,
@_response=nil,
@_results=nil,
@_types=[],
@criteria=
#<Chewy::Query::Criteria:0x007f911c6b1458
@aggregations=
{:group_by=>{:terms=>{:field=>"seo_area.suburb.id", :order=>{:_count=>"asc"}}, :aggs=>{:by_top_hit=>{:top_hits=>{:size=>10}}}}},
@facets={},
@fields=[],
@filters=
[{:geo_distance=>{:distance=>"100km", "seo_area.suburb.coordinates"=>"-27.9836052, 153.3977354"}},
{:bool=>
{:must_not=>[{:terms=>{:id=>[1]}}, {:terms=>{"seo_area.suburb.id"=>[5559]}}],
:must=>[{:term=>{:path_category=>"garden-services"}}, {:term=>{:status=>"active"}}, {:exists=>{:field=>"path_area"}}],
:should=>[]}}],
@options=
{:query_mode=>:must,
:filter_mode=>:and,
:post_filter_mode=>:and,
:preload=>
{:scope=>
#<Proc:0x007f911c6b1700@/Users/serviceseeking/Work/serviceseeking/engines/seo/app/concepts/seo/snippet_page/twins/search.rb:45 (lambda)>},
:loaded_objects=>true},
@post_filters=[],
@queries=[],
@request_options={},
@scores=[],
@script_fields={},
@search_options={},
@sort=[{:_geo_distance=>{"seo_area.suburb.coordinates"=>"-27.9836052, 153.3977354", :order=>"asc", :unit=>"km"}}],
@suggest={},
@types=[]>,
@options={}>
Я использую агрегацию Elasticsearch, поэтому при доступе к агрегации любая сортировка на этапе запроса / поиска будет исключена.
То, что я проходил, это...
aggs: {
by_seo_area_suburb_id: {
terms: {
field: "seo_area.suburb.id",
size: 10,
order: { by_distance: "desc" }
},
aggs: {
by_top_hit: {
top_hits: { size: 10 }
},
by_distance: {
geo_distance: {
field: "seo_area.suburb.coordinates",
origin: "52.3760, 4.894",
ranges: [
{ from: 0, to: 1 },
{ from: 1, to: 2 }
]
}
}
}
}
}
Я получаю эту ошибку, хотя...
[500] {"error":{"root_cause":[{"type":"aggregation_execution_exception","reason":"Invalid terms aggregation order path [by_distance]. Terms buckets can only be sorted on a sub-aggregator path that is built out of zero or more single-bucket aggregations within the path and a final single-bucket or a metrics aggregation at the path end."}],"type":"search_phase_execution_exception","reason":"all shards failed","phase":"query","grouped":true,"failed_shards":[{"shard":0,"index":"snippet_pages","node":"srrlBssmSEGsqpZnPnOJmA","reason":{"type":"aggregation_execution_exception","reason":"Invalid terms aggregation order path [by_distance]. Terms buckets can only be sorted on a sub-aggregator path that is built out of zero or more single-bucket aggregations within the path and a final single-bucket or a metrics aggregation at the path end."}}]},"status":500}
Просто говорит...
Сегменты терминов могут быть отсортированы только по пути субагрегатора, который построен из нуля или нескольких агрегаций с одним сегментом в пределах пути и конечного агрегации с одним сегментом или метрики в конце пути.
Есть идеи?
1 ответ
У вас есть ведра, как это:
1-2
2-3
4-5
и так далее. Это не отдельные корзины с естественным порядком. Вот что говорит вам исключение. Таким образом, вам нужно что-то, чтобы расплавить это до отдельных значений.
Даже если бы вы могли заказать этим. Почему ты? Все с расстоянием от 1 до 2 будут иметь одинаковое значение для сравнения, и их порядок будет неопределенным. Если вам достаточно знать, какие 0-1 и 1-2 и т. Д., Просто измените порядок агрегирования. Сначала возьмите расстояние и сделайте подгруппу для терминов.
В общем, я думаю, что у вас есть сценарий использования, в котором агрегаты не являются тем, что вы хотите, потому что рассмотрите следующие два документа:
{ name: "peter", location: [0,0] }
{ name: "peter", location: [100,0] }
Очевидно, что оба Питера слились бы в единое целое. Но у них есть два разных местоположения, и поэтому расстояние (почти) всегда будет разным. Так как же вы можете заказать петерс по расстоянию? Как только вы агрегируете поле, все остальные поля более или менее отделяются от него, и вы не можете использовать другие поля для этого.
Так. Если вы хотите что-то подобное, вам, скорее всего, придется пройти обычный поиск. Посмотрите на это, как отсортировать поиск по расстоянию:
https://www.elastic.co/guide/en/elasticsearch/guide/current/sorting-by-distance.html