Огромный пробел после заголовка в PDF с помощью Flying Saucer

Question

Огромный пробел после заголовка в PDF с помощью Flying Saucer

Я пытаюсь экспортировать HTML-страницу в PDF с помощью Flying Saucer. По какой-то причине страницы имеют большой пробел после разделения заголовка (id = "divTemplateHeaderPage1"). Ссылка jsFiddle на мой HTML-код, который используется рендерером PDF: https://jsfiddle.net/Sparks245/uhxqdta6/.

Ниже приведен код Java, используемый для рендеринга PDF (Test.html - это тот же HTML-код в скрипте) и рендеринга только одной страницы.

import java.io.IOException;

import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.json.HTTP;
import org.json.JSONException;
import org.json.*;
import org.json.simple.JSONArray;
import org.json.JSONObject;
import org.json.simple.parser.JSONParser;
import org.json.simple.parser.ParseException;

import org.json.simple.parser.*;
import org.xhtmlrenderer.pdf.ITextRenderer;

import com.lowagie.text.DocumentException;
import com.lowagie.text.List;
import com.sun.xml.internal.bind.v2.runtime.unmarshaller.XsiNilLoader.Array;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.OutputStream;


@WebServlet("/PLPDFExport")
public class PLPDFExport extends HttpServlet 
{

    //Option for Serialization
    private static final long serialVersionUID = 1L;

    public PLPDFExport() 
    {
        super();
    }

    //Get method
    protected void doGet(HttpServletRequest request, 
                         HttpServletResponse response) 
                   throws ServletException, 
                          IOException 
    {

    }

    //Post method
    protected void doPost(HttpServletRequest request, 
                          HttpServletResponse response) 
                   throws ServletException, 
                          IOException
    {
            StringBuffer jb = new StringBuffer();
            String line = null;
            int Pages; 
            String[] newArray = null;

            try 
            {
                BufferedReader reader = request.getReader();
                while ((line = reader.readLine()) != null)
                {   jb.append(line);
                }
            } catch (Exception e) { /*report an error*/ }


            try 
            {
                JSONObject obj = new JSONObject(jb.toString());

                Pages = obj.getInt("Pages");

                newArray = new String[1];  
                for(int cnt = 1; cnt <= 1; cnt++)
                {  

                    StringBuffer  buf = new StringBuffer();

                    String base = "C:/Users/Sparks/Desktop/";

                    buf.append(readFile(base + "Test.html"));

                    newArray[0] = buf.toString(); 
                }
            } 


            catch (JSONException e)
            {
                // crash and burn
                throw new IOException("Error parsing JSON request string");
            }


            //Get the parameters

            OutputStream os = null;
            try {

                final File outputFile = File.createTempFile("FlyingSacuer.PDFRenderToMultiplePages", ".pdf");
                os = new FileOutputStream(outputFile);

                ITextRenderer renderer = new ITextRenderer();


                // we need to create the target PDF
                // we'll create one page per input string, but we call layout for the first

                renderer.setScaleToFit(true);
                renderer.isScaleToFit();
                renderer.setDocumentFromString(newArray[0]);

                renderer.layout();
                try {
                    renderer.createPDF(os, false);
                } catch (DocumentException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }

                // each page after the first we add using layout() followed by writeNextDocument()
                for (int i = 1; i < newArray.length; i++) {
                    renderer.setScaleToFit(true);
                    renderer.isScaleToFit();
                    renderer.setDocumentFromString(newArray[i]);
                    renderer.layout();
                    try {
                        renderer.writeNextDocument();
                    } catch (DocumentException e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                    }
                }

                // complete the PDF
                renderer.finishPDF();

                System.out.println("PDF Downloaded to " + outputFile );
                System.out.println(newArray[0]);

            }
            finally {
                if (os != null) {
                    try {
                        os.close();
                    } catch (IOException e) { /*ignore*/ }
                }
            }

            //Return
            response.setContentType("application/json");
            response.setCharacterEncoding("UTF-8");
            response.getWriter().write("File Uploaded");
    }

    String readFile(String fileName) throws IOException {
        BufferedReader br = new BufferedReader(new FileReader(fileName));
        try {
            StringBuilder sb = new StringBuilder();
            String line = br.readLine();

            while (line != null) {
                sb.append(line);
                sb.append("\n");
                line = br.readLine();
            }
            return sb.toString();
        } finally {
            br.close();
        }
    }

}

Ссылка для экспортированного PDF: https://drive.google.com/file/d/13CmlJK0ZDLolt7C3yLN2k4uJqV3TX-4B/view?usp=sharing

Я попытался добавить свойства css, такие как page-break-inside: избегать делений на заголовки, но это не сработало. Также я попытался добавить абсолютные позиции и верхние поля в разделение тела (id = "divTemplateBodyPage1") чуть ниже заголовка div, но пробел продолжает существовать.

Любые предложения будут полезны.

3

java html itext flying-saucer pdf-extraction

Источник

user9024255 16 дек '17 в 12:14

1 ответ

Решение

Другие вопросы по тегам java html itext flying-saucer pdf-extraction

user1622493 16 дек '17 в 15:55 2017-12-16 15:55 · Accepted Answer · 2017-12-16 15:55

Пожалуйста, посмотрите на метаданные вашего PDF:

Вы используете старый сторонний инструмент, который не одобрен iText Group, и который использует iText 2.1.7, версию iText, выпущенную в 2009 году, которая больше не должна использоваться.

Вероятно, было бы неплохо пожаловаться и написать "Мой код не работает" около 7 лет назад, но если бы вы использовали самую последнюю версию iText, результат преобразования вашего HTML в PDF выглядел бы так:

Мне нужна была только одна строка кода, чтобы получить этот результат:

HtmlConverter.convertToPdf(new File(src), new File(dest));

В этой строке src путь к исходному HTML и dest путь к полученному PDF.

Мне нужно было только применить одно небольшое изменение к вашему HTML. Я меняю @page свойства как это:

@page {
  size: 27cm 38cm;
  margin: 0.2cm;
}

Если бы я не изменил эту часть CSS, размер страницы был бы А4, и в этом случае не весь контент соответствовал бы странице. Я также добавил небольшое поле, потому что мне не нравился тот факт, что граница придерживалась близко к сторонам страницы.

Мораль: не используйте старые версии библиотек! Загрузите последнюю версию iText и дополнение к pdfHTML. Вам нужно ядро iText 7 и дополнение pdfHTML. Вы также можете прочитать учебник HTML в PDF.