Xml作为一个非常重要的纯文本格式已经进入了编程的很多领域,作为一个面向应用层面的c#也一样在很多领域离不开Xml。

    但是,c#在很多方面对Xml做了写封装,以至于很多操作Xml的代码,都不需要手动去写。例如,c#写WebService这种需要大量操作Xml的服务,除了极其个别的情况下,基本看不到任何操作Xml的代码。这是c#的一个优势,但是,最近发现正是这样一些c#的优势,导致了新一代c#程序员的能力退化。因为90%的情况下,不需要手动操作Xml,所以,年轻的c#程序员也觉得没必要为了这10%的情况,而去学如何手工读写Xml。真不知道,ms提供了这么简便的工具,是ms做的善事还是作的孽。。。

    好吧,废话就不说了,转入主题。

1.如何用Xml Dom的方式读取Xml

    Xml Dom方式是最原始的一种操作Xml的途径,从.net Framework 1.0开始就开始支持Dom方式。

1.1如何以Dom方式加载Xml

    要读取Xml首先要加载Xml,加载的方式有两种,一种是从流或类似的Reader加载,例如:

image

    当然还可以从字符串加载:

image 

1.1读取无namespace的Xml

    Xml已经准备好了,下面就开始读取这个Xml。现在希望读取data节下面的所有item中的text,那么就可以:

image

    看看运行结果:

image

    但是,这样写的问题有很多,例如在data节点中有非item的节点,这样访问,也就被无差别的把非item项也写出来了。例如把如果数据改成这样:

image

    这样,在data节里面,除了4个item,还有一个other,这个other是不需要的,必须被排除掉,如果直接用第一中ChildNodes去访问的话,会得到这样的结果:

image

    显然“!@#”也被选择出来了,这可不是我们所期望的,

 

 

 

 

 

 

 

    所以,改用XPath的方式访问:

image

    其运行结果为:

image

    很好的other项排除在需要的节点外,这才是我们真正想要的结果:)

1.2读取有namespace的Xml

    和c#一样Xml也有namespace,并且namespace在Xml中的作用巨大,也许你并未感受到namespace的作用,但是,你可能已经不得不面对那些有namespace的Xml了。

    好吧,我们先加载一个有namespace的xml:

image

    这里,我们准备了一个namespace——urn:vwxyzh,并且把这个namespace缩写成v。举个例子来说,v:data就是urn:vwxyzh这个namespace下面的data。

    现在再用原来的XPath去跑一下:

image

    Oh, no!一个也没有选择出来,为什么会这样哪?

    因为原来的/data/item中的data节是没有namespace的data,和urn:vwxyzh的data不是一回事,所以,这个XPath根本定为不到任何节点。

    必须要修改部分代码才能达到我们的目的,先来看看Select方法有哪些重载吧:

image

    第一个重载,就是之前使用的那个,第二个重载,需要额外提供一个XmlNamespaceManager实例,一看名字就知道,这个实例是用于管理Xml的Namespace的。再查看一下这个类的成员:

image

    可以发现,创建这个实例需要一个XmlNameTable,谁能提供这个XmlNameTable的实例哪?XmlDocument本身就提供了这个XmlNameTable:

image

    这样,我们就可以修改为:

image

    先创建一个Manager的实例,然后使用AddNamespace方法,把“v”设置为“urn:vwxyzh”的缩写。然后修改XPath,把data修改成v:data,item修改成v:item,就可以了,现在来看一下运行结果:

image

 

 

 

 

 

 

    Yeah!这就是我们所需要的。

posted on 2009-10-18 16:12  Zhenway  阅读(1627)  评论(3编辑  收藏  举报