Удалите содержимое HTML без потери форматирования, но черный PDF генерируется
PDF генерирует, но он становится пустым, я хочу получить html-данные в формате PDF без потери форматирования, поэтому я пробовал этот код в этом единственном пустом PDF-формате
package config;
import com.lowagie.text.DocumentException;
import org.apache.commons.io.FileUtils;
import org.docx4j.org.xhtmlrenderer.pdf.ITextRenderer;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.IOException;
public class removeHtmlTag {
public static void main(String [] args) throws DocumentException, IOException {
FileUtils.writeByteArrayToFile(new File("removeHtmlTag.pdf"), toPdf("<b>YouAAA gotta walk and don't look back</b>"));
}
/**
* Generate a PDF document
* @param html HTML as a string
* @return bytes of PDF document
*/
private static byte[] toPdf(String html) throws DocumentException, IOException {
final ITextRenderer renderer = new ITextRenderer();
renderer.setDocumentFromString(html);
renderer.layout();
try (ByteArrayOutputStream fos = new ByteArrayOutputStream(html.length())) {
renderer.createPDF(fos);
return fos.toByteArray();
}
}
}
1 ответ
Причина в том, что вы используете неправильный ITextRenderer из пакета docx4j. Предполагается, что Docx4j будет использоваться для обработки документов, а не для преобразования xhtml в PDF. Вы должны использовать, например, "Flying Saucer PDF Rendering", в этом случае pdf - "ОК".
<!-- https://mvnrepository.com/artifact/org.xhtmlrenderer/flying-saucer-pdf -->
<dependency>
<groupId>org.xhtmlrenderer</groupId>
<artifactId>flying-saucer-pdf</artifactId>
<version>9.1.15</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.xhtmlrenderer/flying-saucer-core -->
<dependency>
<groupId>org.xhtmlrenderer</groupId>
<artifactId>flying-saucer-core</artifactId>
<version>9.1.15</version>
</dependency>
В этом случае импорт
import org.xhtmlrenderer.pdf.ITextRenderer;
Кроме того, лучше инкапсулировать xhtml stringinto html тэги, как это
StringBuilder sb = new StringBuilder();
sb.append("<html>").append(System.lineSeparator())
.append("<body>").append(System.lineSeparator())
.append("<b>YouAAA gotta walk and don't look back</b>").append(System.lineSeparator())
.append("</body>").append(System.lineSeparator())
.append("</html>");