Полнотекстовая индексация архивного файла

Привет,
Короче говоря, я должен выяснить, могу ли я реализовать способ индексирования ZIP-файлов.rtf через IFilter в Sql Server 2008 Express для полнотекстового поиска.

Длинная версия: этот вопрос в основном теоретический - я ни опытный, ни достаточно осведомленный, чтобы выяснить, возможно ли такое самостоятельно.

Проблема заключается в следующем. Существует база данных Sql Server Express 2008 R2 ограниченного размера, в которой будут храниться большие файлы.rtf, вероятно, 2-10 тыс. Из них, и индексироваться для полнотекстового поиска. Теперь они, вероятно, не вписываются в ограничение 10 Гб, поэтому мне интересно, можно ли их заархивировать (например, в архиве) и сохранить таким образом. Полнотекстовый поиск должен быть выполним на них, в заархивированном состоянии.

Я думал о том, чтобы попытаться каким-то образом связать ifilters (я понятия не имею, выполнимо ли это), или может быть другое решение, которое я не вижу в atm; Буду признателен за любой вклад, так как я немного растерялся.

1 ответ

Вам может быть намного легче использовать что-то вроде Lucene. Вы можете извлечь текст для файлов и индексировать его.

Другие вопросы по тегам