Lucene создать индекс для слов с умлаутами в стратификации
У меня есть похожая проблема, как описано в этой теме. Я хотел бы использовать что-то вроде GermanNormilizationFilter, чтобы иметь преобразование для умлаутов, таких как 'ue' -> 'ü' и наоборот.
Я использую плагин cassandra stratio и хотел бы создать индекс с помощью оператора cql, как в официальных примерах
1 ответ
По сути, вы хотите использовать часть немецкого анализатора Lucene, но не все.
В cassandra-lucene-index вы можете использовать собственный анализатор, просто сгенерировав jar-файл и включив его в папку cassandra lib.
Кстати, поскольку вам нужна только часть функциональности немецкого анализатора, вы можете создать свой собственный пользовательский интерфейс на основе немецкого анализатора, просто редактируя только некоторые строки.
Если вы внимательно посмотрите на код анализатора Lucene German, вы увидите, что вам нужно только отредактировать (удалить / прокомментировать) некоторые строки в createComponents
метод.