提取word表格中的数据

# 提取数据区域中表格

  • 查看本示例演示效果
  • 本示例关键代码的编写位置,请参考“开始 - 快速上手”里您所使用的开发语言框架的最简集成代码

注意

本文中展示的代码均为关键代码,复制粘贴到您的项目中,按照实际的情况,例如文档路径,用户名等做适当修改即可使用。

在实际的开发过程中,有时会遇到希望提取Word文档中表格数据保存到服务器的需求,此时可以使用PageOffice提取Word文档数据区域中表格数据的功能。在服务器端创建PageOffice的Word命名空间中的WordDocumentReader对象并获取到DataRegion对象,再调用DataRegion对象的openTable方法就可以获得表格对象,进而获取并处理各个单元格的值,比如保存到数据库。

注意

PageOffice获取Word文档中指定位置的数据,是通过调用PageOffice获取数据区域的功能,实现此目的。在PageOffice的概念里提到的数据区域,本质上就是书签,但是只有“PO_”开头的书签才叫数据区域。

# 后端代码

在后端编写代码调用webOpen方法以表单提交模式docSubmitForm打开文件,设置数据区域Editing属性为true,并设置接收处理PageOffice客户端控件提交数据的服务器端后台方法为:saveData,用户在线编辑Word文档数据区域中表格数据,点保存时,服务器端后台方法saveData中就可以通过DataRegion对象就可以获取到完整的表格数据。

注意

由于整个数据区域都是可编辑的,数据区域中的表格也是可以编辑的,包括样式、行列等,所以此实现方式对用户的操作有一定的要求,就是让用户不能随便修改表格的结构,行数、列数、合并单元格等操作,否则服务器端获取表格数据的代码就会无法确定每个单元格数据的含义是什么,也就无法做进一步处理。

java
    PageOfficeCtrl poCtrl = new PageOfficeCtrl(request);
    WordDocumentWriter wordDoc = new WordDocumentWriter();
    //打开数据区域
    DataRegionWriter dTable = wordDoc.openDataRegion("PO_table");
    //设置数据区域可编辑性
    dTable.setEditing(true);
    poCtrl.setWriter(wordDoc);//此行必须
    poCtrl.setSaveDataPage("saveData");
    //webOpen的第一个参数支持能够输出下载文件的Url相对地址或者文件在服务器上的磁盘路径两种方式
    poCtrl.webOpen("D:\\documents\\test.docx", OpenModeType.docSubmitForm, "张三");
.net core
PageOfficeNetCore.PageOfficeCtrl POCtrl = new PageOfficeNetCore.PageOfficeCtrl(Request);
PageOfficeNetCore.Word.WordDocumentWriter doc = new PageOfficeNetCore.Word.WordDocumentWriter();
//打开数据区域
PageOfficeNetCore.Word.DataRegionWriter dTable = doc.OpenDataRegion("PO_table");
//设置数据区域可编辑性
dTable.Editing = true;
POCtrl.SetWriter(doc);//此行必须
POCtrl.SaveDataPage = "SaveData";
//webOpen的第一个参数支持能够输出下载文件的Url相对地址或者文件在服务器上的磁盘路径两种方式
POCtrl.WebOpen("doc/test.doc", PageOfficeNetCore.OpenModeType.docSubmitForm, "tom");

在服务器端后台方法saveData中,创建com.zhuozhengsoft.pageoffice.word命名空间中的WordDocumentReader对象,提取数据区域中的表格。

java
    WordDocumentReader doc = new WordDocumentReader(request, response);
    DataRegionReader dataReg = doc.openDataRegion("PO_table");
    TableReader table = dataReg.openTable(1);
    StringBuilder dataStr = new StringBuilder();
    for (int i = 1; i <= table.getRowsCount(); i++) {
        dataStr.append("<div style='width:220px;'>");
        for (int j = 1; j <= table.getColumnsCount(); j++) {
            dataStr.append("<div style='float:left;width:70px;border:1px solid red;'>" + table.openCellRC(i, j).getValue() + "</div>");
        }
        dataStr.append("</div>");
    }
    //可以在此处编写代码把dataStr输出到控制台,查看提交数据
    doc.close();
.net core
PageOfficeNetCore.Word.WordDocumentReader doc = new PageOfficeNetCore.Word.WordDocumentReader(Request, Response);
await doc.LoadAsync();
PageOfficeNetCore.Word.DataRegionReader dataReg = doc.OpenDataRegion("PO_table");
PageOfficeNetCore.Word.WordTableReader table = dataReg.OpenTable(1);
StringBuilder dataStr = new StringBuilder();
for (int i = 1; i <= table.RowsCount; i++)
{
    dataStr.Append("<div style='width:220px;'>");
    for (int j = 1; j <= table.ColumnsCount; j++)
    {
        dataStr.Append("<div style='float:left;width:70px;border:1px solid red;'>" + table.OpenCellRC(i, j).Value + "</div>");
    }
    dataStr.Append("</div>");
}
//可以在此处编写代码把dataStr输出到控制台,查看提交数据
doc.Close();

# 前端代码

本示例无前端关键代码。

参考链接:https://www.pageoffice.cn/pages/f010ca/
posted @ 2025-05-30 10:02  爱吃苹果皮  阅读(59)  评论(0)    收藏  举报