Как принимать файлы .doc / .docx в elasticsearch?

Я пытаюсь проиндексировать текстовые документы в своей среде elasticsearch. Я пробовал использовать плагин приема-прикрепления elasticsearch, но похоже, что можно принимать только данные в кодировке base64.

Моя цель - индексировать целые каталоги с помощью файлов Word. Я пробовал использовать FSCrawler, но, к сожалению, в настоящее время он содержит ошибку при индексировании текстовых документов. Я был бы очень благодарен, если бы кто-нибудь мог объяснить мне способ индексирования каталогов, содержащих текстовые документы.

0 ответов

Другие вопросы по тегам