Существует ли такая вещь, как средство разбиения по словам SQL Server для венгерского языка?
Я хочу использовать CONTAINS
на полнотекстовый индекс и использовать FORMSOF(...)
по венгерским данным. Является ли это возможным? Я ЗНАЮ, что это не поддерживается по умолчанию в SQL Server.
1 ответ
Решение
SQL Server может загружать пользовательские средства разбиения по словам и парадигматические модули, см. Разделители слов и Stemmers. Если вы не можете найти венгерского стеммера, всегда есть возможность создать свой собственный: Word Breaker и Stemmer Sample, см. Также Получение настраиваемого средства разбиения слов LRSAMPLE для работы на 64-битном SQL Server 2008. Вам не нужно реализовывать словарь самостоятельно, вы можете просто повторно использовать, например, алгоритм libstemmer Hungarian Snowball и упаковать его в качестве основы SQL Server.