Чтение docx файла с таблицей

У меня есть простой документ с одной таблицей. Я хотел бы прочитать его содержание клеток. Я нашел много учебников для письма, но не для чтения.

Я полагаю, что я должен перечислить разделы, но как узнать, что содержит таблицу?

var document = DocX.Create(@"mydoc.docx");

var s = document.GetSections();
foreach (var item in s)
{

}

2 ответа

Я использую следующие псевдонимы пространства имен:

using excel = Microsoft.Office.Interop.Excel;
using word = Microsoft.Office.Interop.Word; 

Вы можете специально получить таблицы, используя этот код:

        private void WordRunButton_Click(object sender, EventArgs e)
        {

            var excelApp = new excel.Application();
            excel.Workbooks workbooks = excelApp.Workbooks;
            var wordApp = new word.Application();
            word.Documents documents = wordApp.Documents;
            wordApp.Visible = false; 
            excelApp.Visible = false;
// You don't want your computer to actually load each one visibly; would ruin performance.

            string[] fileDirectories = Directory.GetFiles("Some Directory", "*.doc*",
                   SearchOption.AllDirectories);

            foreach (var item in fileDirectories)
            {
                word._Document document = documents.Open(item);

                foreach (word.Table table in document.Tables)
                {
                        string wordFile = item;
                        appendName = Path.GetFileNameWithoutExtension(wordFile) + " Table " + tableCount + ".xlsx"; 
                       //Not needed if you're not going to save each table individually

                        var workbook = excelApp.Workbooks.Add(1);
                        excel._Worksheet worksheet = (excel.Worksheet)workbook.Sheets[1];

                        for (int row = 1; row <= table.Rows.Count; row++)
                        {
                            for (int col = 1; col <= table.Columns.Count; col++)
                            {

                                var cell = table.Cell(row, col);
                                var range = cell.Range;
                                var text = range.Text;

                                var cleaned = excelApp.WorksheetFunction.Clean(text);

                                worksheet.Cells[row, col] = cleaned;
                            }
                        }
                        workbook.SaveAs(Path.Combine("Some Directory", Path.GetFileName(appendName)), excel.XlFileFormat.xlWorkbookDefault); 
                        //Last arg can be whatever file extension you want 
                        //just make sure it matches what you set above.

                        workbook.Close();
                        Marshal.ReleaseComObject(workbook);

                    tableCount++;
                }

                document.Close();
                Marshal.ReleaseComObject(document);
            }
//Microsoft apps are picky with memory. Make sure you close and release each instance once you're done with it.
//Failure to do so will result in many lingering apps in the background
            excelApp.Application.Quit();
            workbooks.Close();
            excelApp.Quit();

            Marshal.ReleaseComObject(workbooks);
            Marshal.ReleaseComObject(excelApp);

            wordApp.Application.Quit();
            wordApp.Quit();

            Marshal.ReleaseComObject(documents);
            Marshal.ReleaseComObject(wordApp);
        }

Документ является фактическим типом документа word (word.Document). Убедитесь, что вы проверите на разделение клеток, если они у вас есть!

Надеюсь это поможет!

Если у вас есть только одна таблица в документе, это должно быть довольно просто. Попробуй это:

DocX doc = DocX.Load("C:\\Temp\\mydoc.docx");
Table t = doc.Table[0];
//read cell content
string someText = t.Rows[0].Cells[0].Paragraps[0].Text;

Вы можете циклически проходить по строкам и ячейкам таблицы внутри каждой строки, а также по абзацам внутри каждой ячейки [i], если есть больше абзацев. Вы можете сделать это с помощью простого цикла for:

for (int i = 0; i < t.Rows.Count; i++)
{
someText = t.Rows[i].Cells[0].Paragraphs[0].Text;
}

Надеюсь, поможет.

Другие вопросы по тегам