Изменить стандартный анализатор Lucene

Question

Изменить стандартный анализатор Lucene

Я пытаюсь найти документы по названию с помощью StandardAnalyzer из Lucene 4.10.3. Я читаю цитаты из файла и добавляю двойные кавычки для построения запроса с помощью этого:

Query query = parser.parse("\""+doc.get("title")+"\"");

Проблема в том, что когда он читает цитату, ФИЛИППИНЫ СКАЗЫВАЮТ, ЧТО ДОЛГ ", ЛУЧЕНЕ, ЧЕМ МЕКСИКА возвращает эту ошибку

Cannot parse '"PHILIPPINES SAYS DEBT PACT "BETTER THAN MEXICO'S"': Lexical error at line 1, column 52.  Encountered: <EOF> after : ""

Как я могу решить это?

Спасибо!

1

java lucene tokenize standardanalyzer

Источник

user4941593 23 фев '16 в 14:23

1 ответ

Решение

Другие вопросы по тегам java lucene tokenize standardanalyzer

user1628375 23 фев '16 в 17:39 2016-02-23 17:39 · Accepted Answer · 2016-02-23 17:39

Проблема заключается в том, что нужно избегать цитирования в тексте, который вы ищете. Вы можете избежать поиска текста, используя QueryParser.escape:

Query query = parser.parse("\"" + QueryParser.escape(doc.get("title")) + "\"");

0

Источник

user1628375 23 фев '16 в 17:39