Lucene Tokenizer - Включить пробелы
У нас есть приложение, которое токенизирует определенные данные. У меня проблема в том, что у меня есть поле с разделителями-запятыми, которое нужно токенизировать, но не на пробелах. Например:
"Age 6, Age 7, Age 8"
становится
Age
6
Age
7
Age
8
я нуждаюсь
Age 6
Age 7
Age 8
Есть ли способ изменить поведение по умолчанию только для определенных полей?
Настройки конфига у меня на данный момент:
<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO"
boost="1f" type="System.String"
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration,
Sitecore.ContentSearch.LuceneProvider" />
1 ответ
К сожалению, я не знаю C#, но я знаю Lucene. Поэтому для необходимого поведения вам необходимо использовать PatternAnalyzer, который позволяет вам указать регулярное выражение, которое будет использоваться для токенизации. В вашем случае шаблон как \\,
должен работать для разделения на запятые.