Преобразование всех типов документов (MS DOC +TIFF +JPG), хранящихся в Filenet CE, в PDF

В настоящее время мы разрабатываем приложение Java для захвата документов (все типы могут храниться в файловой сети) из Filenet и отображение его в формате PDF, проблема в том, что мне нужен инструмент для преобразования всех MS типы документов (doc, docx, ppt, pptx,...) в pdf. я пробовал Apache POI а также iText но они просто конвертируют форматы Office 2007 и получают простой текст без форматирования и изображений.

Во-вторых, в графических документах я уже конвертировал изображения в pdf, но мне нужно, чтобы на них были напечатаны аннотации, сделанные программой просмотра изображений апплета IBM. Как я могу получить это?

Мне нужно решение с открытым исходным кодом / бесплатно, любое несвободное решение (например, Snowbound, adptel) будет отклонено заказчиком.

Любая поддержка будет оценена

1 ответ

Решение

Проверьте docx4java, http://www.docx4java.org/trac/docx4j

Может обрабатывать экспорты.docx и.pptx, а документация дает некоторую информацию о том, как обрабатывать старые файлы.doc.

Другие вопросы по тегам