Использование OpenGrok для индексации документов Microsoft Office и т. Д.

Мне было интересно, возможно ли вообще использовать OpenGrok для индексации форматов PPT, XLS, DOC и т. Д. Должно ли это быть запрограммировано мной самостоятельно или уже есть плагин / метод для этого?

1 ответ

В настоящее время нет специального анализатора для извлечения данных из этих типов документов, однако должна быть возможность реализовать его на основе библиотек Java, перечисленных в разделе « Чтение документов Microsoft Word в обычный текст (DOC, DOCX) на Java» (например, Apache POI или Apache). Тика)

Не стесняйтесь сообщать о новом выпуске на https://github.com/oracle/opengrok/issues.

Другие вопросы по тегам