Чтение таблицы из файла docx с использованием Apache POI

Я могу читать таблицы из файла документа. (см. следующий код)

public String readDocFile(String filename, String str) {
        try {
            InputStream fis = new FileInputStream(filename);
            POIFSFileSystem fs = new POIFSFileSystem(fis);
            HWPFDocument doc = new HWPFDocument(fs);

            Range range = doc.getRange();
            boolean intable = false;
            boolean inrow = false;

            for (int i = 0; i < range.numParagraphs(); i++) {
                Paragraph par = range.getParagraph(i);
                //System.out.println("paragraph "+(i+1));
                //System.out.println("is in table: "+par.isInTable());
                //System.out.println("is table row end: "+par.isTableRowEnd());
                //System.out.println(par.text());

                if (par.isInTable()) {
                    if (!intable) {//System.out.println("New table creating"+intable);
                        str += "<table border='1'>";
                        intable = true;
                    }
                    if (!inrow) {//System.out.println("New row creating"+inrow);
                        str += "<tr>";
                        inrow = true;
                    }
                    if (par.isTableRowEnd()) {
                        inrow = false;
                    } else {
                        //System.out.println("New text adding"+par.text());
                        str += "<td>" + par.text() + "</td>";
                    }
                } else {
                    if (inrow) {//System.out.println("Closing Row");
                        str += "</tr>";
                        inrow = false;
                    }
                    if (intable) {//System.out.println("Closing Table");
                        str += "</table>";
                        intable = false;
                    }
                    str += par.text() + "<br/>";
                }
            }
        } catch (Exception e) {
            System.out.println("Exception: " + e);
        }

        return str;
    }

Может кто-нибудь предложить мне, как я могу сделать то же самое с файлом DOCX? Я пытался это сделать. Но не удалось найти замену классу Range.

Пожалуйста помоги.

3 ответа

Решение

По многочисленным просьбам, продвигая комментарий к ответу...

В примерах кода Apache POI вы можете найти пример XWPF SimpleTable

Здесь показано, как создать простую таблицу и как создать ее с множеством необычных стилей.

Предполагая, что вы просто хотите создать простую таблицу с нуля в новой книге, код, который вам нужен, будет выглядеть следующим образом:

// Start with a new document
XWPFDocument doc = new XWPFDocument();

// Add a 3 column, 3 row table
XWPFTable table = doc.createTable(3, 3);

// Set some text in the middle
table.getRow(1).getCell(1).setText("EXAMPLE OF TABLE");

// table cells have a list of paragraphs; there is an initial
// paragraph created when the cell is created. If you create a
// paragraph in the document to put in the cell, it will also
// appear in the document following the table, which is probably
// not the desired result.
XWPFParagraph p1 = table.getRow(0).getCell(0).getParagraphs().get(0);

XWPFRun r1 = p1.createRun();
r1.setBold(true);
r1.setText("The quick brown fox");
r1.setItalic(true);
r1.setFontFamily("Courier");
r1.setUnderline(UnderlinePatterns.DOT_DOT_DASH);
r1.setTextPosition(100);

// And at the end
table.getRow(2).getCell(2).setText("only text");

// Save it out, to view in word
FileOutputStream out = new FileOutputStream("simpleTable.docx");
doc.write(out);
out.close();

В следующем фрагменте кода используется Apache POI 5.0.0, и он хорошо работает при чтении данных таблицы docx.

      public void readDocxTables(String docxFilePath) throws FileNotFoundException, IOException {
    XWPFDocument doc = new XWPFDocument(new FileInputStream(docxFilePath));
    for(XWPFTable table : doc.getTables()) {
        for(XWPFTableRow row : table.getRows()) {
            for(XWPFTableCell cell : row.getTableCells()) {
                System.out.println("cell text: " + cell.getText());
            }
        }
    }
}

Это не Apache POI, но использование стороннего компонента показало, что это намного проще. Пример того, как получить таблицы из файла docx.

Конечно, просто идея, если вы не нашли решение с помощью POI,

Другие вопросы по тегам