Настройка LucidWorks Include Paths для обхода только определенных типов файлов
Я пытаюсь настроить источник веб-данных LucidWorks для индексации только определенных типов файлов. Однако, когда я устанавливаю Включить пути к .*\.html
чтобы сканировать только файлы.html (как упрощенный пример), он только индексирует папку верхнего уровня. Глубина сканирования установлена на -1
и когда я оставляю поле " Включить пути" пустым, оно сканирует все поддерево, как и ожидалось.
Я просмотрел их документацию по созданию источника веб-данных и по использованию регулярных выражений и не могу найти причину, по которой .*\.html
не будет работать, так как .*
должен соответствовать любому персонажу.
1 ответ
Когда я корректировал вопрос, у меня возникла идея, которая была правильным решением. Выкладываю это здесь для потомков.
Просматриваемое содержимое является общей папкой, поэтому оно опирается на список каталогов веб-сервера, который был отфильтрован, поскольку не имеет расширения.html. Так просто добавив .*/
Включить пути исправили проблему.