Конвертировать HTML в документ в Java
Я хотел бы преобразовать html или xhtml документ (желательно со стилями) в формат Microsoft .doc и / или.docx.
Кажется, есть множество примеров для того, чтобы сделать это наоборот, но я не нашел никаких полезных примеров для преобразования в форматы документов MS.
Может кто-нибудь указать мне API или предоставить пример для этого, пожалуйста
Большое спасибо
5 ответов
docx4j 2.8.0 поддерживает преобразование документов и фрагментов XHTML в контент docx. Раскрытие: я написал часть кода.
Я попробовал docjx4j API 2.8.1, и он работает как чудо. У него был ConvertinXHTMLinFile, и он отлично работает. Если кто-то хочет код, я выложу его.
Вот ссылка, которая помогла мне: ConvertInXHTMLFile
Еще одним решением было бы использовать jodconverter, который, кажется, базовое преобразование HTML в документ... он не претендует на то, чтобы делать это хорошо, хотя
Чтобы работать с документами Microsoft, вам, вероятно, придется глубже взглянуть на библиотеку POI Apache.
Тем не менее создание файлов.doc со стилем из (X)HTML требует определенных усилий.
Я провел немного времени, изучая docx4j. Кажется, что он предоставляет хорошие способы для создания HTML-документов из DOCX, но я не вижу ничего наоборот.
На данный момент это все еще выглядит как самый простой метод, так как он работает только с объектами jaxb (я думаю).