摘要: 最近做了一个功能,需要将word文档转化成html的格式,并提取出标题生成导航。考虑到功能的复杂程度,将需要降低为对“标题1”这种格式进行提取。 docx为后缀的文档(word2007)支持XML的文件格式,本质上是一个zip压缩包,解压出来就可以看到所有信息,可能正因为如果,使用XHTMLConv 阅读全文
posted @ 2018-09-25 12:39 CWong 阅读(2917) 评论(0) 推荐(0) 编辑