Понимание \ изменение оценки текста Oracle IDF (частота обратных документов)
Oracle Text использует вариацию IDF. Точный алгоритм не задокументирован.
В сценарии оценка кажется отличной от оценки, которую я получаю при вычислении IDF вручную
Я хотел бы понять, как оракул вычисляет счет, и, возможно, изменить его.
Есть ли способы изменить алгоритм оценки?
Похоже, что таблица DR$indexname$I содержит термин "частота" в поле TOKEN_COUNT - это правильно?
документирована ли структура таблиц DR $?
1 ответ
Вы можете изменить алгоритм оценки, используя шаблон запроса, например:
select id from docs where CONTAINS (text,
'<query>
<textquery grammar="CONTEXT" lang="english"> mustang </textquery>
<score datatype="float" algorithm="DEFAULT" normalization_expr =Ódoc_score+SDATA(price)Ó/>
</query>')>0"
Не намного больше информации здесь 4.1.17 Альтернативный и пользовательский скоринг