FullTextIndex в NexusDB, как токенизировать строку поиска

Question

FullTextIndex в NexusDB, как токенизировать строку поиска

Мы используем NexusDB для небольшой базы данных. У нас есть таблица с определенным FulltextIndex. Индекс настроен со следующими параметрами:

Разделитель символов
ccPunctuationDash
ccPunctuationOther

Пользователь вводит текст поиска в поле редактирования, а затем создается оператор SQL со следующим предложением WHERE (%s заменяется на Editbox.text, конечно):

WHERE CONTAINS(FullIdx, ''%s'')

Когда пользователь вводит несколько слов в поле ввода, это происходит неправильно, так как два отдельных слова должны были быть встроены в предложение WHERE следующим образом:

WHERE CONTAINS(FullIdx, 'word1' and 'word2')

Поэтому мне нужно проанализировать значение текстового поля, отсканировать его на наличие пробелов и разбить текст в этих точках. Это заставило меня задуматься, можно ли было проанализировать текст поиска для каждой настройки индекса Fulltextindex, используя фактическое определение индекса Fulltextindex для создания правильного предложения where.

Таким образом, если ccPunctuationDash включен в определении FulltextIndex, то текст поиска также разделяется на "-".

Если вы думаете об этом, это точно такой же процесс, как и при создании индекса, и все строки токенизируются...

Мой вопрос: какой самый простой способ токенизации строки поиска в соответствии с настройками FUlltextIndex?

0

delphi full-text-indexing nexusdb

Источник

user501717 20 ноя '12 в 08:21

1 ответ

Другие вопросы по тегам delphi full-text-indexing nexusdb

user2023719 30 янв '13 в 03:07 2013-01-30 03:07 · Answer 1 · 2013-01-30 03:07

Самый простой способ... создать пустую таблицу #tevent со строковым полем, с теми же настройками полнотекстового индекса, что и у вашей реальной таблицы. Установить TnxTable.Options включать dsoAddKeyAsVariantField, Загрузите строку для токенизации в строковое поле, а затем просмотрите таблицу, проиндексированную полнотекстовым индексом. Presto, вы получите дополнительное поле, которое представляет собой отсортированные токены. Теперь вы можете перебирать таблицу, чтобы прочитать токены.