Чтение.docx в C++
Я пытаюсь создать программу, которая читает файл.docx и публикует его содержимое в блоге / форуме для личного использования. Наконец-то я понял, как использовать libcurl, чтобы сделать то, что я понял, было самой сложной частью программы. Теперь я просто должен прочитать файл.docx, но попал под затруднение. Я не могу найти документацию о том, как это сделать. Есть идеи?
2 ответа
Самый простой способ - использовать Word для этого. У него есть ограничения на лицензирование.
Вопрос SO Создание, открытие и печать файла слова из C++ имеет несколько хороших ссылок.
Редактировать:
В соответствии с этими вопросами / ответами можно распаковать файл Open XML и напрямую обработать файл XML:
Если вы используете.NET, есть еще (C#) вопросы для чтения:
Если вы хотите остаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы.docx. Существует проект по реализации API для многих языков, я не знаю, насколько он полон или сложен.
В PHP есть скрипт, который может конвертировать из.docx в обычный текст. То есть если вам не страшно, что все документы на русском языке). Это может быть другой вариант (запуск сценария php с помощью системного вызова и анализ результатов из файла)