Как разобрать DOCX XML с помощью JDOM для извлечения данных из DOCX
Так как мы можем увидеть все файлы XML, открыв файл docx с помощью инструмента winzip или winrar.. я хочу извлечь данные из этих файлов xml.. у меня есть вопросы.. 1. Как сначала извлечь все файлы XML Документ DOCX с использованием кода? 2. Как мне приступить к разбору, так как фактические данные присутствуют внутри word/document.xml?
Я новичок в DOM и XML разборе, пожалуйста, помогите мне...
1 ответ
Решение
Я не буду писать вам код, но вам нужно будет выполнить следующие шаги:
- Прочитайте файл docx
- Распакуйте его
- Получить содержимое файла 'word/document.xml'
- Передать этот контент в JDOM
Пожалуйста, напишите новый вопрос, если ваш вопрос становится более конкретным