Преобразование всех типов документов (MS DOC +TIFF +JPG), хранящихся в Filenet CE, в PDF
В настоящее время мы разрабатываем приложение Java для захвата документов (все типы могут храниться в файловой сети) из Filenet
и отображение его в формате PDF, проблема в том, что мне нужен инструмент для преобразования всех MS
типы документов (doc, docx, ppt, pptx,...) в pdf. я пробовал Apache POI
а также iText
но они просто конвертируют форматы Office 2007 и получают простой текст без форматирования и изображений.
Во-вторых, в графических документах я уже конвертировал изображения в pdf, но мне нужно, чтобы на них были напечатаны аннотации, сделанные программой просмотра изображений апплета IBM. Как я могу получить это?
Мне нужно решение с открытым исходным кодом / бесплатно, любое несвободное решение (например, Snowbound
, adptel
) будет отклонено заказчиком.
Любая поддержка будет оценена
1 ответ
Проверьте docx4java, http://www.docx4java.org/trac/docx4j
Может обрабатывать экспорты.docx и.pptx, а документация дает некоторую информацию о том, как обрабатывать старые файлы.doc.