Java使用Jacob转换Word为HTML

从今天开始,我也要养成记录开发中遇到的问题和解决方法的好习惯!微笑

最近开发一个Android项目,需要用到查看Word和Pdf文档的功能,由于Android没有直接显示Word和PDF文档的组件,只有一个Webview能查看html网页,所以决定将文档于服务器端转换为html,之后不论是在线预览还是下载到移动终端都可以直接查看了。

最近在网上查阅相关资料,找到利用Jacob来转换Word为html,除了占用CPU性能多一些,好像还不错(.doc和.docx都可以转换的!)。废话不多说,切入正题,这篇文章就先介绍转换Word为html的过程,Pdf还在研究当中,如果有结果我也会发出来!

 

“JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32 libraries。”

Ps:Jacob只能用于windows系统,如果你的系统不是windows,建议使用Openoffice.org,这个是跨平台的,虽然我没用,但是应该不麻烦,就是需要先安装Openoffice这个软件,然后使用8100服务。至于Poi,说实话,我真不爱用,那个需要先解析word,然后自己覆写成html,工作量大不说,还得不偿失,因为很难保证转换的html内容的格式与原来word文档格式一致,并且.docx转换也很费劲。

 

1、到官网下载Jacob,目前最新版是1.17,地址链接:http://sourceforge.net/projects/jacob-project/

2、将压缩包解压后,Jacob.jar添加到Libraries中(先复制到项目目录中,右键单击jar包选择Build Path—>Add to Build Path);

3、将Jacob.dll放至当前项目所用到的“jre\bin”下面(比如我的Eclipse正在用的Jre路径是D:\Java\jdk1.7.0_17\jre\bin)。
Ps:我就是按照上面的步骤配置的,一点问题没有,但是有些人可能还会报错,比如:java.lang.UnsatisfiedLinkError: no jacob in java.library.path,这是系统没有加载到jacob.dll,网上解决方法是将Jacob.dll放至“WINDOWS\SYSTEM32”下面(我没试过,因为我的直接没问题)

 

Java代码:

[java] view plaincopy
 
    1. public class JacobUtil {  
    2.       
    3.     // 8 代表word保存成html  
    4.     public static final int WORD_HTML = 8;   
    5.   
    6.     public static void main(String[] args) {  
    7.         String docfile = "C:\\Users\\無名\\Desktop\\xxx.doc";  
    8.         String htmlfile = "C:\\Users\\無名\\Desktop\\xxx.html";  
    9.         JacobUtil.wordToHtml(docfile, htmlfile);  
    10.     }  
    11.       
    12.     /**   
    13.      * WORD转HTML   
    14.      * @param docfile WORD文件全路径   
    15.      * @param htmlfile 转换后HTML存放路径   
    16.      */    
    17.     public static void wordToHtml(String docfile, String htmlfile)     
    18.     {     
    19.         // 启动word应用程序(Microsoft Office Word 2003)  
    20.         ActiveXComponent app = new ActiveXComponent("Word.Application");  
    21.         System.out.println("*****正在转换...*****");  
    22.         try    
    23.         {     
    24.             // 设置word应用程序不可见    
    25.             app.setProperty("Visible"new Variant(false));    
    26.             // documents表示word程序的所有文档窗口,(word是多文档应用程序)  
    27.             Dispatch docs = app.getProperty("Documents").toDispatch();    
    28.             // 打开要转换的word文件  
    29.             Dispatch doc = Dispatch.invoke(     
    30.                     docs,     
    31.                     "Open",     
    32.                     Dispatch.Method,     
    33.                     new Object[] { docfile, new Variant(false),   
    34.                             new Variant(true) }, new int[1]).toDispatch();     
    35.             // 作为html格式保存到临时文件  
    36.             Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {     
    37.                     htmlfile, new Variant(WORD_HTML) }, new int[1]);     
    38.             // 关闭word文件  
    39.             Dispatch.call(doc, "Close"new Variant(false));     
    40.         }     
    41.         catch (Exception e)     
    42.         {     
    43.             e.printStackTrace();     
    44.         }     
    45.         finally    
    46.         {     
    47.             //关闭word应用程序  
    48.             app.invoke("Quit"new Variant[] {});     
    49.         }   
    50.         System.out.println("*****转换完毕********");  
    51.     }  
    52. }  
posted @ 2013-10-31 15:38  晴心  阅读(7303)  评论(1编辑  收藏  举报