Как разобрать DOCX XML с помощью JDOM для извлечения данных из DOCX

Так как мы можем увидеть все файлы XML, открыв файл docx с помощью инструмента winzip или winrar.. я хочу извлечь данные из этих файлов xml.. у меня есть вопросы.. 1. Как сначала извлечь все файлы XML Документ DOCX с использованием кода? 2. Как мне приступить к разбору, так как фактические данные присутствуют внутри word/document.xml?

Я новичок в DOM и XML разборе, пожалуйста, помогите мне...

1 ответ

Решение

Я не буду писать вам код, но вам нужно будет выполнить следующие шаги:

  • Прочитайте файл docx
  • Распакуйте его
  • Получить содержимое файла 'word/document.xml'
  • Передать этот контент в JDOM

Пожалуйста, напишите новый вопрос, если ваш вопрос становится более конкретным

Другие вопросы по тегам