Lucene Tokenizer - Включить пробелы

У нас есть приложение, которое токенизирует определенные данные. У меня проблема в том, что у меня есть поле с разделителями-запятыми, которое нужно токенизировать, но не на пробелах. Например:

"Age 6, Age 7, Age 8"

становится

Age
6
Age
7
Age
8

я нуждаюсь

Age 6
Age 7
Age 8

Есть ли способ изменить поведение по умолчанию только для определенных полей?

Настройки конфига у меня на данный момент:

<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO" 
boost="1f" type="System.String" 
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration, 
Sitecore.ContentSearch.LuceneProvider" />

1 ответ

К сожалению, я не знаю C#, но я знаю Lucene. Поэтому для необходимого поведения вам необходимо использовать PatternAnalyzer, который позволяет вам указать регулярное выражение, которое будет использоваться для токенизации. В вашем случае шаблон как \\, должен работать для разделения на запятые.

Другие вопросы по тегам