Существует ли такая вещь, как средство разбиения по словам SQL Server для венгерского языка?

Я хочу использовать CONTAINS на полнотекстовый индекс и использовать FORMSOF(...) по венгерским данным. Является ли это возможным? Я ЗНАЮ, что это не поддерживается по умолчанию в SQL Server.

1 ответ

Решение

SQL Server может загружать пользовательские средства разбиения по словам и парадигматические модули, см. Разделители слов и Stemmers. Если вы не можете найти венгерского стеммера, всегда есть возможность создать свой собственный: Word Breaker и Stemmer Sample, см. Также Получение настраиваемого средства разбиения слов LRSAMPLE для работы на 64-битном SQL Server 2008. Вам не нужно реализовывать словарь самостоятельно, вы можете просто повторно использовать, например, алгоритм libstemmer Hungarian Snowball и упаковать его в качестве основы SQL Server.

Другие вопросы по тегам