fscrawler - обновить существующую запись

Мне нужно искать документы по их содержимому и некоторым пользовательским данным. Итак, моя идея состоит в том, чтобы использовать fscrawler для извлечения контента из документов и хранения его вместе с пользовательскими данными клиентов в одном индексе для облегчения поиска.

Итак, процесс такой:

  1. индексировать документ с пользовательскими данными и идентификатором клиента, который будет использовать fscrawler для обработки файлов
  2. скопировать файл в специальную папку для обработки fscrawler
  3. fscralwer извлекает содержимое файла и помещает его в индекс

Проблема здесь в том, что fscrawler перезаписывает созданный мной документ, удаляя все мои пользовательские данные. Можно ли как-то настроить fscrawler для хранения этих пользовательских данных? Чтобы просто обновить документ, а не перезаписать его полностью (я могу добиться этого, переместив точку 1 в конец и используя UpdateDocument вместо IndexDocument. Но тогда мне нужно дождаться данных fscrawler, что может занять много времени, поэтому я бы хотелось бы этого избежать).

0 ответов

Другие вопросы по тегам