Понимание \ изменение оценки текста Oracle IDF (частота обратных документов)

Oracle Text использует вариацию IDF. Точный алгоритм не задокументирован.

В сценарии оценка кажется отличной от оценки, которую я получаю при вычислении IDF вручную

Я хотел бы понять, как оракул вычисляет счет, и, возможно, изменить его.

  • Есть ли способы изменить алгоритм оценки?

  • Похоже, что таблица DR$indexname$I содержит термин "частота" в поле TOKEN_COUNT - это правильно?

  • документирована ли структура таблиц DR $?

1 ответ

Вы можете изменить алгоритм оценки, используя шаблон запроса, например:

select id from docs where CONTAINS (text,
'<query>
<textquery grammar="CONTEXT" lang="english"> mustang </textquery>
<score datatype="float" algorithm="DEFAULT" normalization_expr =Ódoc_score+SDATA(price)Ó/>
</query>')>0"

Не намного больше информации здесь 4.1.17 Альтернативный и пользовательский скоринг

Другие вопросы по тегам