Как использовать стандартный анализатор Elasticsearch без строчных букв
Я пытаюсь создать анализатор в asticsearch, используя предустановки "стандартного" анализатора, но с одним изменением - без нижнего регистра слов.
Я попытался объединить пробелы и стандартный анализатор так:
PUT /standard_uppercase
{
"settings": {
"analysis": {
"analyzer": {
"rebuilt_standard": {
"tokenizer": "standard",
"filter": [
"standard",
"whitespace"
]
}
}
}
}
}
Но это не дает требуемых результатов. Есть ли способ перезаписать только строчную часть анализатора, но продать в розницу все существующие функции стандартного анализатора?
Заранее спасибо.
1 ответ
Решение
По документации
Определение
Стандартный анализатор состоит из:
Tokenizer
Standard Tokenizer
Фильтры токенов
Standard Token Filter Lower Case Token Filter Stop Token Filter (disabled by default)
Таким образом, вы можете достичь своих целей таким образом:
PUT /standard_uppercase
{
"settings": {
"analysis": {
"analyzer": {
"rebuilt_standard": {
"tokenizer": "standard",
"filter": [
"standard"
]
}
}
}
}
}