Solr DIH Индексирование статуса почты

Я использую Solr DIH для индексирования электронных писем из Outlook. В первый раз, когда я начал процесс индексации, нужно было проиндексировать более 5000 электронных писем. По мере выполнения индексации не было обновлений ни одного из сообщений о состоянии. Сообщения продолжали оставаться следующими: "Всего запросов к источнику данных": "0","Всего полученных строк": "0","Всего обработанных документов": "0","Всего пропущено документов": "0".

Сначала я думал, что процесс DIH завис. Но примерно через 15 минут сообщения о состоянии обработки начали отображать "Всего обработано документов": "1" и т. Д.

Я немного исследовал и узнал, что Solr DIH сначала читает заголовки писем, прежде чем начинать обработку писем. Так что, вероятно, первые 15 минут он читал заголовки.

Мой вопрос: есть ли способ получить обновление о статусе чтения заголовков электронной почты? "Всего обработано заголовков: 25" или что-то в этом роде?

Мой диф конфиг выглядит следующим образом:

<entity folders="INBOX" host="imap.mail.yahoo.com" name="Yahoo Mail" 
password="${dataimporter.request.pwd}" processAttachments="true" 
processor="MailEntityProcessor" protocol="imaps" user="myemail@yahoo.com">  
    <field column="messageId" name="id"/>
    <field column="sentDate" name="lastmodified"/>
    <field column="subject" name="title"/>
</entity>    

0 ответов

Другие вопросы по тегам