Solr DIH Индексирование статуса почты
Я использую Solr DIH для индексирования электронных писем из Outlook. В первый раз, когда я начал процесс индексации, нужно было проиндексировать более 5000 электронных писем. По мере выполнения индексации не было обновлений ни одного из сообщений о состоянии. Сообщения продолжали оставаться следующими: "Всего запросов к источнику данных": "0","Всего полученных строк": "0","Всего обработанных документов": "0","Всего пропущено документов": "0".
Сначала я думал, что процесс DIH завис. Но примерно через 15 минут сообщения о состоянии обработки начали отображать "Всего обработано документов": "1" и т. Д.
Я немного исследовал и узнал, что Solr DIH сначала читает заголовки писем, прежде чем начинать обработку писем. Так что, вероятно, первые 15 минут он читал заголовки.
Мой вопрос: есть ли способ получить обновление о статусе чтения заголовков электронной почты? "Всего обработано заголовков: 25" или что-то в этом роде?
Мой диф конфиг выглядит следующим образом:
<entity folders="INBOX" host="imap.mail.yahoo.com" name="Yahoo Mail"
password="${dataimporter.request.pwd}" processAttachments="true"
processor="MailEntityProcessor" protocol="imaps" user="myemail@yahoo.com">
<field column="messageId" name="id"/>
<field column="sentDate" name="lastmodified"/>
<field column="subject" name="title"/>
</entity>