Настройка LucidWorks Include Paths для обхода только определенных типов файлов

Я пытаюсь настроить источник веб-данных LucidWorks для индексации только определенных типов файлов. Однако, когда я устанавливаю Включить пути к .*\.html чтобы сканировать только файлы.html (как упрощенный пример), он только индексирует папку верхнего уровня. Глубина сканирования установлена ​​на -1 и когда я оставляю поле " Включить пути" пустым, оно сканирует все поддерево, как и ожидалось.

Я просмотрел их документацию по созданию источника веб-данных и по использованию регулярных выражений и не могу найти причину, по которой .*\.html не будет работать, так как .* должен соответствовать любому персонажу.

1 ответ

Решение

Когда я корректировал вопрос, у меня возникла идея, которая была правильным решением. Выкладываю это здесь для потомков.


Просматриваемое содержимое является общей папкой, поэтому оно опирается на список каталогов веб-сервера, который был отфильтрован, поскольку не имеет расширения.html. Так просто добавив .*/ Включить пути исправили проблему.

Другие вопросы по тегам