Фильтр жетона Elasticsearch не работает
Я пытаюсь это на локальной установке 1.7.5 эластичного поиска
http://localhost:9200/_analyze?filter=shingle&tokenizer=keyword&text=alkis stack
я вижу это
{
"tokens":[
{
"token":"alkis stack",
"start_offset":0,
"end_offset":11,
"type":"word",
"position":1
}
]
}
И я ожидал увидеть что-то подобное
{
"tokens":[
{
"token":"alkis stack",
"start_offset":0,
"end_offset":11,
"type":"word",
"position":1
},
{
"token":"stack alkis",
"start_offset":0,
"end_offset":11,
"type":"word",
"position":1
}
]
}
Я что-то пропустил?
Обновить
{
"number_of_shards": 2,
"number_of_replicas": 0,
"analysis": {
"char_filter": {
"map_special_chars": {
"type": "mapping",
"mappings": [
"- => \\u0020",
". => \\u0020",
"? => \\u0020",
", => \\u0020",
"` => \\u0020",
"' => \\u0020",
"\" => \\u0020"
]
}
},
"filter": {
"permutate_fullname": {
"type": "shingle",
"max_shingle_size": 4,
"min_shingle_size": 2,
"output_unigrams": true,
"token_separator": " ",
"filler_token": "_"
}
},
"analyzer": {
"fullname_analyzer_search": {
"char_filter": [
"map_special_chars"
],
"filter": [
"asciifolding",
"lowercase",
"trim"
],
"type": "custom",
"tokenizer": "keyword"
},
"fullname_analyzer_index": {
"char_filter": [
"map_special_chars"
],
"filter": [
"asciifolding",
"lowercase",
"trim",
"permutate_fullname"
],
"type": "custom",
"tokenizer": "keyword"
}
}
}
}
И я пытаюсь проверить, как это
http://localhost:9200/INDEX_NAME/_analyze?analyzer=fullname_analyzer_index&text=alkis stack
1 ответ
Решение
Индексируйте имя и фамилию в двух отдельных полях в ES, так же, как они есть в БД. Текст, полученный как запрос, может быть проанализирован (match
например, query_string
Является ли). И есть способы поиска в обоих полях одновременно со всеми терминами в строке поиска. Я думаю, что вы слишком усложняете вариант использования с одним именем за один раз и создаете перестановки имен во время индексации.