Android中使用POI加载与显示word文档

最近打算实现一个功能:在Android中加载显示Word文档,当然这里不是使用外部程序打开。查看一些资料后,打算采用poi实现,确定了以下实现思路:

  1. 将ftp中的word文档下载到本地。
  2. 调用poi将word文档转成html格式并保存到本地
  3. 使用WebViewer加载显示本地html

这里略去下载word文档到本地不谈,仅仅后面两步,看起来还是比较简单的,网上也有相关代码。不过在使用过程中遇到了两个大的问题,着实让笔者费了一番脑筋。这里给大家列出来,希望能帮助大家节省些时间。

 
首先,说一下POI使用方法
  1. 下载poi-bin-3.9-20121203.tar.gz并解压,提取查看Office文档所依赖的包。
  2. word相关操作依赖于poi-3.9-20121203.jar和poi-scratchpad-3.9-20121203.jar两个包,将其加入到Android程序的libs文件夹中。
  3. 将word转html并保存到本地,然后使用WebViewer加载显示本地html。整个代码如下
package com.example.office;

import java.io.BufferedWriter;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.util.List;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;


import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.PicturesManager;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.PictureType;
import org.w3c.dom.Document;

import android.os.Bundle;
import android.app.Activity;
import android.webkit.WebSettings;
import android.webkit.WebView;

public class MainActivity extends Activity {
    
    private String docPath = "/mnt/sdcard/documents/";
    private String docName = "test.doc";
    private String savePath = "/mnt/sdcard/documents/";    
        
    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        String name = docName.substring(0, docName.indexOf("."));
        try {
            if(!(new File(savePath+name).exists()))
                new File(savePath+name).mkdirs();
            convert2Html(docPath+docName,savePath+name+".html");
        } catch (Exception e){
            e.printStackTrace();
        }
        //WebView加载显示本地html文件
        WebView webView = (WebView)this.findViewById(R.id.office);       
        WebSettings webSettings = webView.getSettings();
        webSettings.setLoadWithOverviewMode(true);    
        webSettings.setSupportZoom(true);
        webSettings.setBuiltInZoomControls(true);
        webView.loadUrl("file:/"+savePath+name+".html");
    }
    
    /**
     * word文档转成html格式 
     * */
    public void convert2Html(String fileName, String outPutFile)  
            throws TransformerException, IOException,  
            ParserConfigurationException {  
        HWPFDocument wordDocument = new HWPFDocument(new FileInputStream(fileName));
        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());       
        
        //设置图片路径
        wordToHtmlConverter.setPicturesManager(new PicturesManager()  
         {  
             public String savePicture( byte[] content,  
                     PictureType pictureType, String suggestedName,  
                     float widthInches, float heightInches )  
             {  
                 String name = docName.substring(0,docName.indexOf("."));
                 return name+"/"+suggestedName;  
             }  
         } );
    
        //保存图片
       List<Picture> pics=wordDocument.getPicturesTable().getAllPictures();  
        if(pics!=null){  
            for(int i=0;i<pics.size();i++){  
                Picture pic = (Picture)pics.get(i);  
                System.out.println( pic.suggestFullFileName()); 
                try {  
                    String name = docName.substring(0,docName.indexOf("."));
                    pic.writeImageContent(new FileOutputStream(savePath+ name + "/"
                            + pic.suggestFullFileName()));
                } catch (FileNotFoundException e) {  
                    e.printStackTrace();  
                }    
            }  
        }
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();  
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);
  
        TransformerFactory tf = TransformerFactory.newInstance();  
        Transformer serializer = tf.newTransformer();  
        serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");  
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");  
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);  
        out.close();  
        //保存html文件
        writeFile(new String(out.toByteArray()), outPutFile); 
    }
    
    /**
     * 将html文件保存到sd卡
     * */
    public void writeFile(String content, String path) {  
        FileOutputStream fos = null;  
        BufferedWriter bw = null;  
        try {  
            File file = new File(path);  
            if(!file.exists()){
                file.createNewFile();
            }                
            fos = new FileOutputStream(file);  
            bw = new BufferedWriter(new OutputStreamWriter(fos,"utf-8"));  
            bw.write(content);  
        } catch (FileNotFoundException fnfe) {  
            fnfe.printStackTrace();  
        } catch (IOException ioe) {  
            ioe.printStackTrace();  
        } finally {  
            try {  
                if (bw != null)  
                    bw.close();  
                if (fos != null)  
                    fos.close();  
            } catch (IOException ie) {  
            }  
        }  
    }
}
activity_main.xml如下
<RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:tools="http://schemas.android.com/tools"
    android:layout_width="match_parent"
    android:layout_height="match_parent" >

    <WebView
        android:id = "@+id/office"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"
        android:layout_centerHorizontal="true"
        android:layout_centerVertical="true"
        android:text="@string/hello_world"
        tools:context=".MainActivity"/>
</RelativeLayout>

上面代码中convert2Html用于将word文档转换html。下面的代码则是使用WebViewer加载显示本地html文件。 

        WebView webView = (WebView)this.findViewById(R.id.office);       
        WebSettings webSettings = webView.getSettings();
        webSettings.setLoadWithOverviewMode(true);    
        webSettings.setSupportZoom(true);
        webSettings.setBuiltInZoomControls(true);
        webView.loadUrl("file:/"+savePath+name+".html");

下面来详细说说存在的两个问题 

问题一:使用时有如下报错:

09-23 17:40:12.350: W/System.err(29954): java.lang.NullPointerException
09-23 17:40:12.350: W/System.err(29954):      at org.apache.poi.hwpf.converter.AbstractWordUtils.compactChildNodesR(AbstractWordUtils.java:146)

 
这个是POI自身的bug具体原因在于AbstractWordUtils.java中没有对child2.getParent是否为空进行判断。将如下代码
child2.getParentNode().removeChild( child2 );
i--;

更改为

if(child2.getParentNode()!=null){
  child2.getParentNode().removeChild( child2 );
  i--;
}

然而这里需要重新编译AbstractWordUtils.java类,将源工程下载后,找到AbstractWordUtils.java后,试验了以下方法。

  1. 直接使用javac编译,会提示很多类库找不到
  2. 使用反编译工具,反编译后更改个文字还可以,更改代码就有点勉强了。
  3. 将整个poi导入eclipse后重新编译,工作量太大,没有进行尝试。
最后绞尽脑汁还是想到了一个相当简单的方法(高手请飘过~),为此还得瑟了几分钟。具体如下:
  1. 将AbstractWordUtils.java,poi-3.9-20121203.jar,poi-scratchpad-3.9-20121203.jar放到同一目录下,非必需
  2. 通过引用已有的两个包进行编译,编译命令如下:javac -cp d:\poi-3.9-20121203.jar;d:\poi-scratchpad-3.9-20121203.jar; d:\AbstractWordUtils.java ;编译后生成AbstractWordUtils.class文件。
  3. 将poi-3.9-20121203.jar的后缀改成zip,将AbstractWordUtils.class拖到zip中覆盖掉原有文件,然后将后缀zip改成jar即可。点击此处下载更改好的poi-3.9-20121203.jar。
问题二:找不到HWPFDocument错误:java.lang.NoClassDefFoundError: org.apache.poi.hwpf.HWPFDocument或者内存不足问题:Unable to execute dex: Java heap space
 
上述问题取决于使用poi-3.9-20121203.jar,poi-scratchpad-3.9-20121203.jar包的不同方式。
 
如果将两个jar包放在libs目录下,就不会出现类找不到的错误;但很可能会出现内存不足的问题。笔者开始通过更改eclipse安装文件夹下的eclipse.ini文件增大内存到512M,解决了内存不足的问题;后来加入到另外一个更大的程序后,又出现内存不足的问题,调整到800M解决。值得注意的是,如果把最大值调整到1024M,eclipse就无法启动了(和你的机器相关),这实在不能算是个好的解决方案。以下为笔者机器上修改后eclipse.ini文件,注意标红的部分。
 -startup
plugins/org.eclipse.equinox.launcher_1.2.0.v20110502.jar
--launcher.library
plugins/org.eclipse.equinox.launcher.win32.win32.x86_1.1.100.v20110502
-showsplash
org.eclipse.platform
--launcher.XXMaxPermSize
256m
--launcher.defaultAction
openFile
-vmargs
-Xms256m
-Xmx800m
 
如果通过使用Add Library的方法加载jar包,就不会出现内存的问题,但是会出现类找不到的的问题:java.lang.NoClassDefFoundError: org.apache.poi.hwpf.HWPFDocument。虽然csdn上有人通过将新增的user lib放置到最上面的方法解决了,但我试了下没有生效,不得已还是采用了第一种方法。这里也希望解决了该问题的人能够留下评论或联系方式,方便请教。
 
最后,补充几点
  1. 目前poi只针对2003的doc格式,不支持2007及其以上的docx格式。
  2. 经测试发现,偶尔会出现的问题,不知如何解决。这里建议内部程序简单预览,外部程序打开word文档详细浏览的方式。
  3. poi和android API的版本或ADT版本有关;有的在java环境下良好,在android环境下就有问题,还请多多注意。
  4. 整个工程实例代码请点击此处
posted @ 2013-10-08 08:32  esrixa  阅读(14508)  评论(4编辑  收藏  举报