博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

xpath读书笔记

Posted on 2006-07-12 20:04  daniel-shen  阅读(236)  评论(0)    收藏  举报

xpath中节点类型:
element 节点(拥有其他节点)
attribute 属性节点
text
namespace
processing-instruction
comment 注解
document (root) nodes 整个文档的根节点


关系:
Parent 父亲节点
Children 子节点
Siblings 拥有共同父亲节点的节点
Ancestors 父亲节点或父亲父亲节点的父亲节点(祖先节点)
Descendants 子孙节点

语法:
例子xml文本:
<?xml version=“1.0“ encoding=“utf-8“?>
<bookstore>
<book>
<title></title>
<price></price>
</book>
<book>
<title></title>
<price></price>
</book>
</bookstore>

  路径表达式       说明
bookstore                  bookstore 的所有子节点
/bookstore                选择根节点bookstore,当表达式以/开头时,表示到这个节点的绝对路径
bookstore/book        选择bookstore下所有的book节点。
//book                      选择根节点下所有的book节点
bookstore//book       选择所有book节点,只要该book节点是bookstore的子孙节点。
//@lang                    选择所有的lang属性。
/bookstore/book[1]         选择bookstore的第一个book节点
/bookstore/book[last()]  选择bookstore的最后一个book节点
/bookstore/book[last()-1]  选择bookstore的最后第二个book节点
/bookstore/book[position()<3]  选择bookstore的前两个book节点
//title[@lang]     选择所有包含lang属性的title节点
//title[@lang='eng']   选择所有包含lang属性且值为eng的book节点
/bookstore/book[price>35.00]   选择bookstore的子节点book中属性price大于35.00的节点
/bookstore/book[price>35.00]/title 选择满足上一条件的title子节点
/bookstore/*   选择bookstore的所有子节点
//*   选择所有节点
//title[@*]  选择拥有属性的节点


child::book  当前节点的所有book子节点
attribute::lang  当前节点的lang属性
child::* 当前节点的所有子节点
attribute::* 当前节点的所有属性
 child::text()  当前节点的所有文本节点 

child::node() 当前节点的所有子节点
descendant::book  当前节点的所有book子孙节点
ancestor::book   当前节点的所有book祖先节点
ancestor-or-self::book  当前节点的所有book祖先节点,如果当前节点本身也为book节点,则包括他自己
child::*/child::price   sorry,can't understand.


运算符:

| Computes two node-sets //book | //cd Returns a node-set with all book and cd elements
+ Addition 加 6 + 4 10
- Subtraction 减 6 - 4 2
* Multiplication 乘

6 * 4

24
div Division  除 8 div 4 2
= Equal 相等 price=9.80 true if price is 9.80
false if price is 9.90
!= Not equal  不等 price!=9.80 true if price is 9.90
false if price is 9.80
< Less than  小于 price<9.80 true if price is 9.00
false if price is 9.80
<= Less than or equal to  小于等于 price<=9.80 true if price is 9.00
false if price is 9.90
> Greater than  大于 price>9.80 true if price is 9.90
false if price is 9.80
>= Greater than or equal to  大于等于 price>=9.80 true if price is 9.90
false if price is 9.70
or or  或者 price=9.80 or price=9.70 true if price is 9.80
false if price is 9.50
and and   而且 price>9.00 and price<9.90 true if price is 9.80
false if price is 8.50
mod Modulus (division remainder)  取余 5 mod 2 1

测试xpath的页面(w3school提供)
http://www.w3schools.com/xpath/tryit.asp?filename=try_xpath_select_cdnodes


http://www.ibm.com/developerworks/cn/xml/x-cert/part5/index.html
的关于xpath的教程中得到的1个实例:

一个XML文档树

我们来构造一棵XML文档树,作为后面举例的依托:

	<A id="a1">
            <B id="b1">
            <C id="c1">
            <B name="b"/>
            <D id="d1"/>
            <E id="e1"/>
            <E id="e2"/>
            </C>
            </B>
            <B id="b2"/>
            <C id="c2">
            <B/>
            <D id="d2"/>
            <F/>
            </C>
            <E/>
            </A>
            

以下将要介绍一些XPath中节点匹配的基本方法。

路径匹配

路径匹配与文件路径的表示相仿,比较好理解。有以下几个符号:

(1)用“/”指示节点路径
如“/A/C/D” 表示节点"A"的子节点"C"的子节点"D",即id值为d2的D节点, “/”表示根节点。

(2)用“//” 表示所有路径以"//"后指定的子路径结尾的元素
如“//E” 表示所有E元素,结果是所有三个E元素,如“//C/E”表示所有父节点为C的E元素,结果是id值为e1和e2的两个E元素 。

(3)用“*” 表示路径的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素,即name值为b的B元素、 id值为d1的D元素和id值为e1和e2的两个E元素
“/*/*/D”表示上面有两级节点的D元素,匹配结果是id值为d2的D元素 ,如“//*”表示所有的元素。





回页首


位置匹配

对于每一个元素,它的各个子元素是有序的。

如:/A/B/C[1]表示A元素→B元素→C元素的第一个子元素,得到name值为b的B元素

/A/B/C[last()]表示A元素→B元素→C元素的最后一个子元素,得到id值为e2的E元素

/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置号大于1的元素,得到id值为d1的D元素和两个具有id值的E元素





回页首


属性及属性值

在XPath中可以利用属性及属性值来匹配元素,要注意的是,元素的属性名前要有"@"前缀。例如:

//B[@id]表示所有具有属性id的B元素,结果为id值为b1和b2的两个B元素

//B[@*]表示所有具有属性的B元素,结果为两个具有id属性的B元素和一个具有name属性B元素

//B[not(@*)]表示所有不具有属性的B元素,结果为A元素→C元素下的B元素

//B[@id="b1"] id值为b1的B元素,结果为A元素下的B元素





回页首


亲属关系匹配

XML文档可归结为树型结构,因此任何一个节点都不是孤立的。通常我们把节点之间的归属关系归结为一种亲属关系,如父亲、孩子、祖先、后代、兄弟等等。在对元素进行匹配时,同样可以用到这些概念。例如:

//E/parent::* 表示所有E节点的父节点元素,结果为id值为a1的A元素和id值为c1的C元素

//F/ancestor::* 表示所有F元素的祖先节点元素,结果为id值为a1的A元素和id值为c2的C元素

/A/child::* 表示A的子元素,结果为id值为b1、b2的B元素,id值为c2的C元素,以及没有任何属性的E元素

/A/descendant::* 表示A的所有后代元素,结果为除A元素以外的所有其它元素

//F/self::* 表示所有F的自身元素,结果为F元素本身

//F/ancestor-or-self::* 表示所有F元素及它的祖先节点元素,结果为F元素、F元素的父节点C元素和A元素

/A/C/descendant-or-self::* 表示所有A元素→C元素及它们的后代元素,结果为id值为c2的C元素、该元素的子元素B、D、F元素

/A/C/following-sibling::* 表示A元素→C元素的紧邻的后序所有兄弟节点元素,结果为没有任何属性的E元素

/A/C/preceding-sibling::* 表示A元素→C元素的紧邻的前面所有兄弟节点元素,结果为id值为b1和b2的两个B元素

/A/B/C/following::* 表示A元素→B元素→C元素的后序的所有元素,结果为id 为b2的B元素、无属性的C元素、无属性的B元素、id为d2的D元素、无属性的F元素、\无属性的E元素。

/A/C/preceding::* 表示A元素→C元素的前面的所有元素,结果为id为b2的B元素、id为e2的E元素、id为e1的E元素、id为d1的D元素、name为 b的B元素、id为c1的C元素、id为b1的B元素





回页首


条件匹配

条件匹配就是利用一些函数的运算结果的布尔值来匹配符合条件的节点。常用于条件匹配的函数有四大类:节点函数、字符串函数、数值函数、布尔函数。例如last()、position()等等,这里我们就不再赘述。

以上这些匹配方法中,用得最多的还要数路径匹配。在上一章样式表的例子中,无论是在语句<xsl:template match="学生花名册">中,还是在语句 <xsl:value-of select="名字"/>中,都是依靠给出相对于当前路径的子路径来定位节点的。