Coldfusion 8 - Проблемы с индексацией больших данных с использованием Verity

В настоящее время я использую Coldfusion 8 с Verity на сервере K2. Я использую запрос для индексации нескольких разных столбцов в моей таблице с помощью cfindex. Одна из колонн представляет собой большой тип varchar.

Кажется, что, когда данные индексируются, сохраняются только первые 30 КБ, в результате чего результаты не возвращаются, если я что-то ищу после этого. Я попытался переместить несколько различных фраз и слов дальше в пределах данных, в пределах 30 КБ, и затем появились результаты.

Затем я провел больше тестов на достоверность, используя команду browse в командной строке, чтобы увидеть, что на самом деле находится в коллекции.

т.е. Coldfusion8\verity\collection \\parts browse 0000001.ddd

Я обнаружил, что индексируемое тело (CF_BODY) никогда не превышает размер 32000.

Может кто-нибудь сказать мне, есть ли фиксированный размер индекса на документ для достоверности?

Большое спасибо,

Ричард

1 ответ

Изюминка

Версия 6 имеет ограничения оператора:

  • до 32 764 детей в одной "теме" для ЛЮБОГО оператора
  • до 64 детей на NEAR

Превышение этих значений не обязательно приводит к сообщению об ошибке. Когда вы ищете, вы уверены, что не превышаете их?

Источник

Документация Verity, Приложение B. Ограничения запросов говорят о двух ограничениях: времени поиска и оператора. Цитата ниже - это целый раздел, рассказывающий о последнем, прямо из книги.

Руководство по языку и теме Verity Query, версия 6.0:

Обратите внимание на следующие ограничения на использование операторов:

Для ЛЮБОГО оператора может быть максимум 32 764 детей. Если тема превышает это ограничение, поисковая система не всегда возвращает сообщение об ошибке.

Оператор NEAR может оценить только 64 ребенка. Если тема превышает это ограничение, поисковая система не возвращает сообщение об ошибке.

Например, предположим, что вы создали большую тему, в которой используется оператор ACCRUE с 8365 дочерними элементами. Этот раздел превышает ограничение 1024 для любой темы класса ACCRUE и ограничение 16000/3 для общего числа узлов. В этом случае вы не можете заменить ЛЮБОЙ на ACCRUE, поскольку это приведет к тому, что тема превысит ограничение в 8 000 для максимального числа дочерних элементов для ЛЮБОГО оператора. Вместо этого вы можете построить более глубокую древовидную структуру, сгруппировав темы и создав несколько именованных подузлов.

Другие вопросы по тегам