Конвертировать HTML в документ в Java

Я хотел бы преобразовать html или xhtml документ (желательно со стилями) в формат Microsoft .doc и / или.docx.

Кажется, есть множество примеров для того, чтобы сделать это наоборот, но я не нашел никаких полезных примеров для преобразования в форматы документов MS.

Может кто-нибудь указать мне API или предоставить пример для этого, пожалуйста

Большое спасибо

5 ответов

Решение

docx4j 2.8.0 поддерживает преобразование документов и фрагментов XHTML в контент docx. Раскрытие: я написал часть кода.

Я попробовал docjx4j API 2.8.1, и он работает как чудо. У него был ConvertinXHTMLinFile, и он отлично работает. Если кто-то хочет код, я выложу его.

Вот ссылка, которая помогла мне: ConvertInXHTMLFile

Еще одним решением было бы использовать jodconverter, который, кажется, базовое преобразование HTML в документ... он не претендует на то, чтобы делать это хорошо, хотя

Чтобы работать с документами Microsoft, вам, вероятно, придется глубже взглянуть на библиотеку POI Apache.

Тем не менее создание файлов.doc со стилем из (X)HTML требует определенных усилий.

Я провел немного времени, изучая docx4j. Кажется, что он предоставляет хорошие способы для создания HTML-документов из DOCX, но я не вижу ничего наоборот.

На данный момент это все еще выглядит как самый простой метод, так как он работает только с объектами jaxb (я думаю).

Другие вопросы по тегам