C# WinForm开发系列 - Word - peterzb

C# WinForm开发系列 - Word

Posted on 2009-07-06 00:52 peterzb 阅读(23250) 评论(0) 收藏举报

[翻译]
Anup Shinde著Integrating Microsoft Word in your .NET applications

[介绍]
本文解释如何在.NET应用程序中使用Word，它将介绍你如何在你的程序中使用最完美的文字编辑器。

[代码的使用]

推荐首先看一下最基础的文章

当我们在我们的程序中创建一个窗口的时候，我们不希望它的关闭按钮、最大化、最小化按钮还起作用。

02. 将Word文档导入RichTextBox

03. 从Word 2007 DOCX文件中提取文字

翻译

Eugene Pankov.著Using DocxToText to Extract Text from DOCX Files

简介

如今，微软已经转为使用基于XML格式存储文档内容了。这也给需要进行在Word文件(*.docx)搜索内容的程序员带来了一些小问题。当然，如果在安装了Microsoft Office 2007的计算机上，是没什么问题的；但是，你的程序要是运行在没有Office的服务器上呢？

这里有三个选择：
1. 安装Microsoft Office 2007，并使用其DLL
2. 使用第三方的链接库，如"Office Open XML C# Library."
3. 自己写代码.

事实上，你还有另外一个选择：就是使用本文的DocxToText。:)

DocxToText类

本类只有一个功能，那就是从*.docx文件中，提取出文字。不过，在我们深入了解其代码之前，我想提示一下，Microsoft Word *.docx文件是压缩成zip文档的XML文档，包含文字、类型、图像等等。因此，我们不得不对其进行解包。如果，你在使用.NET 3.0，你可以使用System.IO.Packaging空间的Package类。不过，我在这里用于.NET 2.0平台，所以，使用了一个开源的ZIP库SharpZipLib. http://www.icsharpcode.net/OpenSource/SharpZipLib/

如果你重新命名你的*.docx文件成*.zip文件，并打开这个zip文件，你就会见到下面的内容：

首先，我们必须读取[Content_Types].xml文件，从中找到document.xml文件。通常，Microsoft把它隐藏在/word子目录中，不过如果这个文档不是Microsoft Word创建的，它可能存在与文件的任何的地方。接下来，我们就可以匹配document.xml，从中提取出文本了。

本文的代码中的ReadNode()方法，实现了上面的工作：它提取出字符串、图像、tab和目录，并连接成最终的字符串。

04. c# 实现Word联接Excel的MailMerge功能

05. 扩展GridView控件(8) - 导出数据源的数据为Excel、Word或Text

06. 开源代码系列之Office文档读写(Excel/Word)

07. 实用Word使用技巧大全

08. 关注VSTO,从C# 读取Word开始

09. 让IE浏览器提示下载或直接打开word文档

10. 使用jsp实现word、excel格式报表打印

11. .NET1.1下，使用C#自动生成Word2003文档（通过操作COM组件实现）

12. asp.net中生成word文件的问题。

13. 从ASP.NET得到Microsoft Word文档

14. WORD对话框打开时命令无法执行的解决方法