Полнотекстовая индексация архивного файла
Привет,
Короче говоря, я должен выяснить, могу ли я реализовать способ индексирования ZIP-файлов.rtf через IFilter в Sql Server 2008 Express для полнотекстового поиска.
Длинная версия: этот вопрос в основном теоретический - я ни опытный, ни достаточно осведомленный, чтобы выяснить, возможно ли такое самостоятельно.
Проблема заключается в следующем. Существует база данных Sql Server Express 2008 R2 ограниченного размера, в которой будут храниться большие файлы.rtf, вероятно, 2-10 тыс. Из них, и индексироваться для полнотекстового поиска. Теперь они, вероятно, не вписываются в ограничение 10 Гб, поэтому мне интересно, можно ли их заархивировать (например, в архиве) и сохранить таким образом. Полнотекстовый поиск должен быть выполним на них, в заархивированном состоянии.
Я думал о том, чтобы попытаться каким-то образом связать ifilters (я понятия не имею, выполнимо ли это), или может быть другое решение, которое я не вижу в atm; Буду признателен за любой вклад, так как я немного растерялся.
1 ответ
Вам может быть намного легче использовать что-то вроде Lucene. Вы можете извлечь текст для файлов и индексировать его.