Как использовать стандартный анализатор Elasticsearch без строчных букв

Я пытаюсь создать анализатор в asticsearch, используя предустановки "стандартного" анализатора, но с одним изменением - без нижнего регистра слов.

Я попытался объединить пробелы и стандартный анализатор так:

PUT /standard_uppercase
{
"settings": {
"analysis": {
  "analyzer": {
    "rebuilt_standard": {
      "tokenizer": "standard",
      "filter": [
        "standard",
        "whitespace"       
      ]
    }
  }
}
}
}

Но это не дает требуемых результатов. Есть ли способ перезаписать только строчную часть анализатора, но продать в розницу все существующие функции стандартного анализатора?

Заранее спасибо.

1 ответ

Решение

По документации

Определение

Стандартный анализатор состоит из:

Tokenizer

    Standard Tokenizer 

Фильтры токенов

    Standard Token Filter
    Lower Case Token Filter
    Stop Token Filter (disabled by default)

Таким образом, вы можете достичь своих целей таким образом:

PUT /standard_uppercase
{
  "settings": {
    "analysis": {
      "analyzer": {
        "rebuilt_standard": {
          "tokenizer": "standard",
          "filter": [
            "standard"   
          ]
        }
      }
    }
  }
}
Другие вопросы по тегам