XML Schema 学习笔记

项目要用到XML,XSLT,以及XML Schema 等技术,开始学习,转载一些资料

XML Schema(1):最简单的Schema文档
如何写一个最简单的XML Schema文档呢?

 

首先,我们写出一个最简单的XML文档.

hello.xml
-------------------
<?xml version="1.0"?> 
<greeting>Hello World!!</greeting>

(一个根元素:greeting;且这个元素不含属性,无子元素,内容是字符串。)

hello.xsd
----------
<?xml version="1.0"?> 
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
  <xsd:element name="greeting" type="xsd:string"/>
</xsd:schema>

XML Schema文档后缀名是.xsd,完全符合XML语法,根元素是schema,命名空间xmlns:xsd="http://www.w3.org/2001/XMLSchema,用元素<element>定义实例文档中的元素,如greeting。

XML Schema(2):含子元素的稍复杂Schema文档 

 

假设实例文档是如下的:

customer.xml
-----------
<customer>
  <name>teiki</name>
  <address>No.237, Road Waitan, Shanghai</address>
</customer>

则可以写出以下的XML Schema文档:
customer.xsd
----------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:   <xsd:element name="customer">
4:    <xsd:complexType>
5:      <xsd:sequence>
6:        <xsd:element name="name" type="xsd:string"/>
7:        <xsd:element name="address" type="xsd:string" />
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11: </xsd:schema>

实例文档customer.xml中,<customer>元素含有两个子元素,所以我们在Schema文档中采用ComplexType来定义该元素。

sequence表示子元素依次出现的顺序。

XML Schema(3):含子元素和孙元素的更复杂Schema文档

 

这次我们给出一个更加复杂一些的文档:

address.xml
---------------
<customer>
  <name>Teiki</name>
  <address>
    <!-- address追加一个地址子元素 -->
    <prefecture>Zhejiang</prefecture>
    <city>Hangzhou</city>
    <street>Xilu Road, No.121, 7F</street>
  </address>
</customer>


为此,我们需要一个更加复杂一点的Schema文档:

address.xsd
-----------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:   <xsd:element name="customer">
5:     <xsd:complexType>
6:       <xsd:sequence>
7:         <xsd:element name="name" type="xsd:string"/>
8:         <!-- 追加子元素address-->
9:         <xsd:element name="address">
10:          <xsd:complexType>
11:            <xsd:sequence>
12:              <xsd:element name="prefecture" type="xsd:string"/>
13:              <xsd:element name="city" type="xsd:string" />
14:              <xsd:element name="street" type="xsd:string" />
15:            </xsd:sequence>
16:          </xsd:complexType>
17:        </xsd:element>
18:        <!-- end -->
19:      </xsd:sequence>
20:    </xsd:complexType>
21:  </xsd:element>
22:
23:</xsd:schema>
不过,我们还可以采用ref元素来重新编写这个Schema文档:
address2.xsd
----------------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:   <xsd:element name="customer">
5:     <xsd:complexType>
6:       <xsd:sequence>
7:         <xsd:element name="name" type="xsd:string"/>
8:         <xsd:element ref="address"/>
9:       </xsd:sequence>
10:    </xsd:complexType>
11:  </xsd:element>
12:
13:  <xsd:element name="address">
14:    <xsd:complexType>
15:      <xsd:sequence>
16:        <xsd:element name="prefecture" type="xsd:string"/>
17:        <xsd:element name="city" type="xsd:string" />
18:        <xsd:element name="street" type="xsd:string" />
19:      </xsd:sequence>
20:    </xsd:complexType>
21:  </xsd:element>
22:
23: </xsd:schema>
使用ref元素可以直接将其指向另一个模块,使文档更加具有可读性。

XML Schema(4):如何定义属性呢? 
加入实例文档的元素包含属性,怎么办呢?

customer2.xml
---------------
<customer id="001718">
  <name>Teiki</name>
  <address>No.237, Road Waitan, Shanghai</address>
</customer>

那就这样写Schema文档:
customer2.xsd
------------------
1: <?xml version="1.0"?>
2: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:   <xsd:element name="customer">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element name="name" type="xsd:string"/>
8:        <xsd:element name="address" type="xsd:string" />
9:      </xsd:sequence>
10:      <!-- 增加属性定义 -->
11:      <xsd:attribute name="id" type="xsd:string"/>
12:    </xsd:complexType>
13:  </xsd:element>
14:
15: </xsd:schema>

很简单,在<sequence>元素定义完成后,再用<attribute>元素id。


XML Schema(5):如何定义相同子元素的数量? 

 

先看这个简单的订购数据实例文档:

order.xml
---------
<order>
  <orderItem>Accounting Book</orderItem>
  <orderItem>Taxation Book</orderItem>
</order>

假设<orderItem>元素,即每次的订购书目不能超过10种,那该怎么写这个Schema文档呢?这里要用到<element>的maxOccurs属性。

order.xsd
--------------------
1:<?xml version="1.0"?>
2:<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:  <xsd:element name="order">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element name="orderItem"   type="xsd:string"  maxOccurs="10" />
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11:
12:</xsd:schema>

第7行中的maxOccurs属性为10,代表orderItem元素可以最大有10个。如果,不设定元素个数,则可以用maxOccurs="unbounded"来定义.

类似,如果要定义最小值,可以使用minOccurs,比如下面这句:
<xsd:element name="orderItem" type="xsd:string" minOccurs="5" maxOccurs="10"/>
这两个属性缺省值都是1。

XML Schema(6):如何定义可选项的子元素?

 

假如上面的订书数据中,可以用书名或者书号任一一种订购,则实例文档可能如下:

order2.xml
-----------------
<order>
  <orderItem>
    <!--书名订购-->
    <name>Accounting Book</name>
  </orderItem>
  <orderItem>
    <!--书号订购-->
    <id>7-5058-3496-7</id>
  </orderItem>
</order>

这时书写Schema文档还需要使用choice元素。

order2.xsd
-------------------------
1:<?xml version="1.0"?>
2:<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:  <xsd:element name="order">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element ref="orderItem" maxOccurs="10" />
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11:
12:  <xsd:element name="orderItem">
13:    <xsd:complexType>
14:      <xsd:choice>
15:        <xsd:element name="name" type="xsd:string"/>
16:        <xsd:element name="id" type="xsd:string"/>
17:      </xsd:choice>
18:    </xsd:complexType>
19:  </xsd:element>
20:
21:</xsd:schema>

XML Schema(7):稍微更复杂的可选项子元素

 

再稍微修改一下订书数据的实例文档:

order3.xml
-----------------
<order>
  <orderItem>
    <name>Accounting Book</name>
    <quantity>2</quantity>
  </orderItem>
  <orderItem>
    <id>7-5058-3496-7</id>
  </orderItem>
</order>

这里假定<quantity>值为1时,缺省。

如何修改Schema文档呢?

order3.xsd
-----------------
1:<?xml version="1.0"?>
2:<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:  <xsd:element name="order">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element ref="orderItem" maxOccurs="10"/>
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11:
12:  <xsd:element name="orderItem">
13:    <xsd:complexType>
14:      <xsd:sequence>
15:        <xsd:choice>
16:          <xsd:element name="name" type="xsd:string"/>
17:          <xsd:element name="id" type="xsd:string"/>
18:        </xsd:choice>
19:        <xsd:element name="quantity" type="xsd:string" minOccurs="0"/>
20:      </xsd:sequence>
21:    </xsd:complexType>
22:  </xsd:element>
23:
24:</xsd:schema>

19行中的quantity最少出现值为0,也就是可以有,也可以没有。
当然,也可以直接在<choice>元素中,包含quantity,然后定义它的minOccurs。


XML Schema(8):内置简单类型

 

内建于XML Schema的简单类型有44种。他们在XML Schema推荐标准的第二部分中公布,下面这是一张内置类型的层次结构图:

http://www.w3.org/TR/2001/PR-xmlschema-2-20010330/type-hierarchy.jpg

XML Schema(9):自定义简单类型

 

如果内置简单类型的44种还不能满足要求,怎么办呢?下面学习自定义简单类型。(XML的扩展性充分体现在这里)

例如这个实例文档:

order4.xml
-----------------
<order>
  <orderItem>
    <id>7-5058-3496-7</id>
    <quantity>5</quantity>
  </orderItem>
</order>

ID是一个标准的ISBN编码,我们怎么定义这个ISBN编码呢?

<xsd:simpleType name="idType">
  <xsd:restriction base="xsd:string">
    <xsd:pattern value="\d{1}-\d{4}-\d{4}-\d{1}"/>
  </xsd:restriction>
</xsd:simpleType>

idType是一个自定义的简单类型。
我们对它做了限制:
<xsd:restriction base="xsd:string">代表它是基于一个字符串类型。再用pattern元素来描述该字符串的形式。

value="\d{1}-\d{4}-\d{4}-\d{1}"这是一个正则表达式,关于正则表达式,以后再介绍。嘻嘻!

利用这个自定义的简单类型,我们可以重新写Schema文档:

order4.xsd
---------------
1:<?xml version="1.0"?>
2:<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:  <xsd:element name="order">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element ref="orderItem" maxOccurs="10"/>
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11:
12:  <xsd:element name="orderItem">
13:    <xsd:complexType>
14:      <xsd:sequence>
15:        <xsd:element name="id" type="idType"/>
16:        <xsd:element name="quantity" type="xsd:integer"/>
17:      </xsd:sequence>
18:    </xsd:complexType>
19:  </xsd:element>
20:  
21:  <xsd:simpleType name="idType">
22:    <xsd:restriction base="xsd:string">
23:      <xsd:pattern value="\d{1}-\d{4}-\d{4}-\d{1}"/>
24:    </xsd:restriction>
25:  </xsd:simpleType>
26:  
27:</xsd:schema>


假如我们事先确定好ID只有3个,即只有3个ISBN是可选的,那怎么办?我们可以用enumeration元素来进行列举。

<xsd:simpleType name="idType">
  <xsd:restriction base="xsd:string">
    <xsd:enumeration value="7-5058-3496-7"/>
    <xsd:enumeration value="7-5005-6450-3"/>
    <xsd:enumeration value="7-3020-6069-7"/>
  </xsd:restriction>
</xsd:simpleType>


再来看订购量quantity的值,如果我们设定其值必须在1-10之间,该怎么办呢?可以这些自定义一个简单类型。

<xsd:simpleType name="quantityType">
  <xsd:restriction base="xsd:integer">
    <xsd:minInclusive value="1"/>
    <xsd:maxInclusive value="10"/>
  </xsd:restriction>
</xsd:simpleType>

其中,minInclusive,maxInclusive分别代表该类型的取值范围。

所以最终修改后的Schema文档如下:

order4-1.xsd
----------------------
1:<?xml version="1.0"?>
2:<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:  <xsd:element name="order">
5:    <xsd:complexType>
6:      <xsd:sequence>
7:        <xsd:element ref="orderItem" maxOccurs="10"/>
8:      </xsd:sequence>
9:    </xsd:complexType>
10:  </xsd:element>
11:
12:  <xsd:element name="orderItem">
13:    <xsd:complexType>
14:      <xsd:sequence>
15:        <xsd:element name="id" type="idType"/>
16:        <xsd:element name="quantity" type="quantityType"/>
17:      </xsd:sequence>
18:    </xsd:complexType>
19:  </xsd:element>
20:  
21:  <xsd:simpleType name="idType">
22:    <xsd:restriction base="xsd:string">
23:      <xsd:enumeration value="7-5058-3496-7"/>
    <xsd:enumeration value="7-5005-6450-3"/>
    <xsd:enumeration value="7-3020-6069-7"/>
26:    </xsd:restriction>
27:  </xsd:simpleType>
28:  
29:  <xsd:simpleType name="quantityType">
30:    <xsd:restriction base="xsd:integer">
31:      <xsd:minInclusive value="1"/>
32:      <xsd:maxInclusive value="10"/>
33:    </xsd:restriction>
34:  </xsd:simpleType>
35:
36:</xsd:schema>

XML Schema(10):定义属性

 

最后,我们再来讲讲元素的属性如何在Schema文档中定义。

比如上面的order.xml实例文档中:

<order>
  <orderItem id="7-5058-3496-7" />
</order>

对此,我们在Schema文档中采用一个attribute来定义:

order.xsd
---------
<xsd:element name="orderItem">
  <xsd:complexType>
    <xsd:sequence>  ←空元素
    </xsd:sequence>  
    
    <!--定义该元素属性-->
    <xsd:attribute name="id" type="xsd:string"/>
  </xsd:complexType>
</xsd:element>

那么,实例文档中该属性值是必须的还是可有可无的呢?我们可以这样限制:

<xsd:attribute name="id" type="idType" use="required"/>

这里我们讲id属性类型作为一种自定义数据类型idType。
而且,用attribute元素的use属性来定义是否是必须的属性。
required是必须值,optional是可选值,prohibited是无属性值。


那么对于属性的缺省值,我们怎么定义呢?
比如:
<order>
  <orderItem id="4-8443-1780-6" quantity="3"/>
</order>

我们还可以用attribute元素的另一个属性default来定义:
<xsd:attribute name="quantity" type="xsd:integer" default="1"/>

所以,我们可以重新写出一个Schema文档:

order2.xsd
--------------
<xsd:element name="orderItem">
  <xsd:complexType>
    <xsd:sequence></xsd:sequence>
    <xsd:attribute name="id" type="idType" use="required"/>
    <xsd:attribute name="quantity" type="xsd:integer" default="1"/>
  </xsd:complexType>
</xsd:element>

上面的属性我们定义我们还可以采用属性组的办法来重新改写Schema文档。

 

order3.xsd
----------------
1:    <xsd:element name="orderItem">
2:      <xsd:complexType>
3:        <xsd:sequence></xsd:sequence>
4:        <xsd:attributeGroup ref="orderItemAttributes"/>
5:      </xsd:complexType>
6:    </xsd:element>
7:
8:    <xsd:attributeGroup name="orderItemAttributes">
9:      <xsd:attribute name="id" type="idType" use="required"/>
10:      <xsd:attribute name="quantity" type="xsd:integer" default="1"/>
11:    </xsd:attributeGroup>

这个属性组就不详细解释了,不过,大家一看就清楚了吧。

最后,我们写一个完整的订书order.xml的Schema文档。
1:  <?xml version="1.0"?>
2:  <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
3:
4:    <xsd:element name="order">
5:      <xsd:complexType>
6:        <xsd:sequence>
7:          <xsd:element ref="orderItem" maxOccurs="10"/>
8:        </xsd:sequence>
9:      </xsd:complexType>
10:    </xsd:element>
11:
12:    <xsd:element name="orderItem">
13:      <xsd:complexType>
14:        <xsd:sequence></xsd:sequence>
15:        <xsd:attributeGroup ref="orderItemAttributes"/>
16:      </xsd:complexType>
17:    </xsd:element>
18:
19:    <xsd:attributeGroup name="orderItemAttributes">
20:      <xsd:attribute name="id" type="idType" use="required"/>
21:      <xsd:attribute name="quantity" type="xsd:integer" default="1"/>
22:    </xsd:attributeGroup>
23:
24:    <xsd:simpleType name="idType">
25:      <xsd:restriction base="xsd:string">
26:        <xsd:pattern value="\d{1}-\d{4}-\d{4}-\d{1}"/>
27:      </xsd:restriction>
28:    </xsd:simpleType>
29:
30:  </xsd:schema>


 




posted @ 2007-11-05 14:00  gaoyang0303  阅读(330)  评论(0编辑  收藏  举报