Asp.net中Word文件转换成HTML

最近在项目中使用到了一个Word转换为HTML的功能,于是自己写了一个示例,关键代码如下:

//存放word文件的完整路径
string wordPath = Server.MapPath("/word/test.doc");
//存放html文件的完整路径
string htmlPath = Server.MapPath("/html/test.html");
            
//上传word文件, 由于只是做示例,在这里不多做文件类型、大小、格式以及是否存在的判断
FileUpload1.SaveAs(wordPath);

#region 文件格式转换
//请引用Microsoft.Office.Interop.Word
ApplicationClass word = new ApplicationClass();
Type wordType 
= word.GetType();
Documents docs 
= word.Documents;

// 打开文件
Type docsType = docs.GetType();
object fileName = wordPath; //"f:\\cc.doc";
Document doc = (Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { fileName, truetrue });

//判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建)
if (File.Exists(htmlPath)) { File.Delete(htmlPath); }
//每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files)
if (Directory.Exists(htmlPath.Replace(".html"".files")))   

    Directory.Delete(htmlPath.Replace(
".html"".files"), true);
};

//转换格式,调用word的“另存为”方法
Type docType = doc.GetType();
object saveFileName = htmlPath; //"f:\\aaa.html";
docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML });

// 退出 Word
wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null);

#endregion

以上代码,在.net framework4.0 中,可能会出一编译错误:

无法嵌入互操作类型“……”,请改用适用的接口

查阅资料,找到解决方案,记录如下:

选中项目中引入word的dll,鼠标右键,选择属性,把“嵌入互操作类型”设置为False。

 

下载源码:/Files/linyechengwei/WordToHTML.rar

 

posted on 2011-03-25 11:30  凡夫·俗子  阅读(7068)  评论(1编辑  收藏  举报