使用dom4j的xPath解析XML

 
books.xml:
Xml代码 复制代码 收藏代码
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <books>  
  3.     <!--This is a test for dom4j, jakoes, 2007.7.19-->  
  4.     <book show="yes" url="lucene.net">  
  5.         <title id="456">Lucene Studing</title>  
  6.     </book>  
  7.     <book show="yes" url="dom4j.com">  
  8.         <title id="123">Dom4j Tutorials</title>  
  9.     </book>  
  10.     <book show="no" url="spring.org">  
  11.         <title id="789">Spring in Action</title>  
  12.     </book>  
  13.     <owner>O'Reilly</owner>  
  14. </books>  
<?xml version="1.0" encoding="UTF-8"?>
<books>
    <!--This is a test for dom4j, jakoes, 2007.7.19-->
    <book show="yes" url="lucene.net">
        <title id="456">Lucene Studing</title>
    </book>
    <book show="yes" url="dom4j.com">
        <title id="123">Dom4j Tutorials</title>
    </book>
    <book show="no" url="spring.org">
        <title id="789">Spring in Action</title>
    </book>
    <owner>O'Reilly</owner>
</books>


下面我们使用dom4j的xPath来解析:

segment of ParseXML.java:

   
Java代码 复制代码 收藏代码
  1. public void parseBooks(){   
  2.           
  3.         SAXReader reader = new SAXReader();   
  4.         try {   
  5.             Document doc = reader.read("books.xml");   
  6.             Node root = doc.selectSingleNode("/books");   
  7.             List list = root.selectNodes("book[@url='dom4j.com']");   
  8.               
  9.             for(Object o:list){   
  10.                   
  11.                 Element e = (Element) o;   
  12.                 String show=e.attributeValue("show");   
  13.                 System.out.println("show = " + show);   
  14.             }   
  15.              
  16.         } catch (Exception e) {   
  17.             e.printStackTrace();   
  18.         }   
  19.     }  
public void parseBooks(){
       
        SAXReader reader = new SAXReader();
        try {
            Document doc = reader.read("books.xml");
            Node root = doc.selectSingleNode("/books");
            List list = root.selectNodes("book[@url='dom4j.com']");
           
            for(Object o:list){
               
                Element e = (Element) o;
                String show=e.attributeValue("show");
                System.out.println("show = " + show);
            }
          
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

 Node root = doc.selectSingleNode("/books");是读取刚才加载的xml文档内的books节点下的所有内容,对于本例也是整个xml文档。
  当然我们也可以加载/books下的某一个节点,如:book节点
Node root = doc.selectSingleNode("/books/book");
或:Node root = doc.selectSingleNode("/books/*");
注意:如果有多个book节点,它只会读取第一个
root.asXML()将打印:
<book show="yes" url="lucene.net">
        <title id="456">Lucene Studing</title>
</book>

  既然加载了这么多,那我怎么精确的得到我想要的节点呢,别急,看下面:
List list = root.selectNodes("book[@url='dom4j.com']");
它的意思就是读取books节点下的book节点,且book的节点的url属性为dom4j.com
为什么使用list来接收呢,如果有两个book节点,且它们的url属性都为dom4j.com,此时就封闭到list里了。

  如果想读取books下的所有book节点,可以这样:
List list = root.selectNodes("book");

  如果想读取books节点下的book节点下的title节点,可以这样:
List list2 = root.selectNodes("book[@url='dom4j.com']/title[@id='123']");

  注意:selectNodes()参数的格式:
  节点名[@属性名='属性值'],如:book[@url='dom4j.com']
  如果有多个节点,用“/”分开,如:book[@url='dom4j.com']/title[@id='123']

  最后就是读取封闭在List里的内容了,可以用Node来读取,也可以用Element来转换。
attributeValue("属性")是读取该节点的属性值
getText()是读取节点的的内容。



posted @ 2014-09-17 15:36  萧痕♂泪  阅读(198)  评论(0)    收藏  举报