Чтение.docx в C++

Я пытаюсь создать программу, которая читает файл.docx и публикует его содержимое в блоге / форуме для личного использования. Наконец-то я понял, как использовать libcurl, чтобы сделать то, что я понял, было самой сложной частью программы. Теперь я просто должен прочитать файл.docx, но попал под затруднение. Я не могу найти документацию о том, как это сделать. Есть идеи?

2 ответа

Решение

Самый простой способ - использовать Word для этого. У него есть ограничения на лицензирование.

Вопрос SO Создание, открытие и печать файла слова из C++ имеет несколько хороших ссылок.

Редактировать:

В соответствии с этими вопросами / ответами можно распаковать файл Open XML и напрямую обработать файл XML:

Если вы используете.NET, есть еще (C#) вопросы для чтения:

Если вы хотите остаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы.docx. Существует проект по реализации API для многих языков, я не знаю, насколько он полон или сложен.

В PHP есть скрипт, который может конвертировать из.docx в обычный текст. То есть если вам не страшно, что все документы на русском языке). Это может быть другой вариант (запуск сценария php с помощью системного вызова и анализ результатов из файла)

Другие вопросы по тегам