【PHP XML与dtd概述【完整版】】

一、XML文件简介

关于XML的大多数人都知道一些,HTML->xhtml->xml,这个顺序本来应当是HTML发展的顺序。

XML可以当做配置文件使用,还可以充当小型的数据库。

version:文档符合xml1.0规范,我们学习的一般都是1.0
encoding:文档字符编码,比如gb2312,一般使用utf-8
standalone:文档定义是否独立使用
standalone="yes",表名文档独立使用
standalone="no":默认

XML文档有且必须仅有一个根元素

根元素定义:
一个完全包含文档中其他所有元素的元素
根元素的其实标记要放在所有其他元素的起始标记之前
根元素的结束标记要放在所有其他元素的结束标记之后。

元素、标签、节点指的是同一个东西,在XML文件编程的时候,我们统一使用节点这个名称,这样显得更专业~

另外,如果标签中间没有内容,就是用但标签来表示,比如<name/>

PHP在解析XML文件的时候有时候会认为有换行符,当做内容的一部分,所以开始标签和结束标签最好在同一行。

<name>宋江</name>

<name>

宋江

</name>

并不等价。

 

XML命名规范:
1.标签区分大小写。
2.不能以数字或者下划线打头
3.不能包含空格
4名称中间不能包含冒号:

XML文件的注释使用HTML文件中的注释方法。

XML文件中的属性值要用双引号包起来。

二、dtd文件概述。

dtd概念:

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,称之为XML约束,dtd是约束XML文件书写规范的一种约束。

PHP中比较重要的两种约束:dtd约束、schema约束。

dtd约束XML文件的必要性:

举例说明:

XML文件中现在有结点person,但是里面除了有<name>、<age>之外,还有<除毛净重><面积>,这就不合理了。

dtd不仅可以约束XML,还可以约束xhtml、HTML等

dtd文档的格式详解:

基本语法:<!ELEMENT NAME CONTENT>

ELEMENT是关键字,NAME是元素名称,CONTENT是元素类型

CONTENT的类型有以下几种:
EMPTY:该元素不能包含子元素和文本,但可以有属性(空元素)
ANY:该元素可以包含任何在DTD中定义的元素内容
#PCDATA:可以包含任何字符数据,但是不能在其中包含任何子元素
其他类型:以上三种类型的组合

简单dtd文件示例:

1 <!ELEMENT 班级(学生+)>//代表根节点班级至少需要有一个学生节点
2 <!ELEMENT 学生(名字,年龄,介绍)>//学生标签中可以使用的标签有名字、年龄、介绍
3 <!ELEMENT 介绍(#PCDATA)>//介绍标签中的内容只能是字符类型,即文本类型,不能再嵌套其它标签

组合示例:

1 <!ELEMENT 班级(班长?,组长*,学生+)>
2 //表示班级中只有一个班长,可以有组长(没有或者多个),至少有一个学生

通配符讲解:

+表示1-n,*表示0-n;n>=1
?表示只能出现一次,就是说只能出现一次或者0次
()用来给元素分组
|用来选择符号
,是顺序符号,控制xml文件的书写顺序。

 

dtd文件属性定义:

属性定义语法:

<!ATTLIST 元素名称
属性名字 属性类型 属性特点
属性名字 属性类型 属性特点
>

属性类型有:

CDATA:表示属性值可以是字符或者数字
ID:代表属性的值是唯一的,并且要以字母开头
IDREF/IDREFS:id引用,引用类型的;属性值要在xml文档中有定义,前者只可以引用一个,后者可以引用多个,之间用空格隔开
Emumerated:枚举类型,顾名思义,如性别,只能是男和女

ENTITY/ENTITIES:前者是引用实体,后者是参数实体

属性特点有以下几种:

#REQUIRED :该属性必须有
#IMPLIED :该属性可以有也可以没有
#FIXED value :该属性的值是固定值
DEFAULT value:默认值,如果没有给属性值

举例:

举例:婚姻状态  (单身|已婚|离婚)   #REQUIRED:表示婚姻状态属性必须从单身、已婚、离婚中选择一个,而且必须有此属性

引用实体用法:

<!ENTITY 实体名 "内容">
在xml文件中使用的时候:&实体名;

参数实体用法:

<!ENTITIES % 实体名称 实体内容>
在dtd文件中使用:%实体名称;

四、XML引入dtd约束

dtd分为内部dtd和外部dtd

内部dtd:将dtd的定义写在XML文件中

外部dtd:将的dtd单独写在一个dtd文件中,将之引入XML文件中。

引入dtd语法格式:

内部dtd的格式:<!DOCTYPE 根元素 [定义内容]>
外部dtd文档:<!DOCTYPE 根元素 SYSTEM "DTD文件路径">
内外部DTD文档结合:<!DOCTYPE 根元素 SYSTEM "DTD文件路径"[定义内容]>

注意:当引用的文件是一个公共的文档的时候,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" “DTD文件的URL”>

 

复杂dtd综合案例:

产品目录dtd

 1 <!DOCTYPE CATALOG [
 2 
 3 <!ENTITY AUTHOR "John Doe">
 4 <!ENTITY COMPANY "JD Power Tools, Inc.">
 5 <!ENTITY EMAIL "jd@jd-tools.com">
 6 
 7 <!ELEMENT CATALOG (PRODUCT+)>
 8 
 9 <!ELEMENT PRODUCT
10 (SPECIFICATIONS+,OPTIONS?,PRICE+,NOTES?)>
11 <!ATTLIST PRODUCT
12 NAME CDATA #IMPLIED
13 CATEGORY (HandTool|Table|Shop-Professional) "HandTool"
14 PARTNUM CDATA #IMPLIED
15 PLANT (Pittsburgh|Milwaukee|Chicago) "Chicago"
16 INVENTORY (InStock|Backordered|Discontinued) "InStock">
17 
18 <!ELEMENT SPECIFICATIONS (#PCDATA)>
19 <!ATTLIST SPECIFICATIONS
20 WEIGHT CDATA #IMPLIED
21 POWER CDATA #IMPLIED>
22 
23 <!ELEMENT OPTIONS (#PCDATA)>
24 <!ATTLIST OPTIONS
25 FINISH (Metal|Polished|Matte) "Matte" 
26 ADAPTER (Included|Optional|NotApplicable) "Included"
27 CASE (HardShell|Soft|NotApplicable) "HardShell">
28 
29 <!ELEMENT PRICE (#PCDATA)>
30 <!ATTLIST PRICE
31 MSRP CDATA #IMPLIED
32 WHOLESALE CDATA #IMPLIED
33 STREET CDATA #IMPLIED
34 SHIPPING CDATA #IMPLIED>
35 
36 <!ELEMENT NOTES (#PCDATA)>
37 
38 ]>
View Code

该dtd我们首先可以看出是一个内部dtd,其次,我们可以看出,该dtd每定义完一个节点,都紧接着在后面将该节点的属性列出来,这是一种良好的书写规范。

学习PHP对dtd的要求就是能看懂以上的dtd文档,并要求根据dtd文件写出相应的XML文件。并不要求会写dtd,因为那是项目经理干的事情。

五、使用js验证XML文件的规范性。

由于浏览器默认不会验证XML文件是否满足的dtd文档的约束条件,所以我们需要自己写代码验证,为此,IE5.0以上的版本均提供了XML解析工具:Microsoft.XMLDom,开发人员可以编写js代码,利用这个解析工具装载XML文件,并对XML文件进行dtd验证。

实例代码:

dtd_control.dtd文档内容如下:

1 <!ELEMENT person (student+,moniter?)>
2 <!ELEMENT student (name,age,sex)>
3 <!ELEMENT age (#PCDATA)>
4 <!ELEMENT name (#PCDATA)>
5 <!ELEMENT sex (#PCDATA)>
6 <!ELEMENT moniter (name,age,sex)>

Person.xml文件内容如下:

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <!DOCTYPE person SYSTEM "dtd_control.dtd">
 3 <person>
 4     <student>
 5         <name>张三</name>
 6         <age>16</age>
 7         <sex></sex>
 8     </student>
 9     <student>
10         <name>张燕</name>
11         <age>17</age>
12         <sex></sex>
13     </student>
14     <moniter>
15         <name>赵六</name>
16         <age>20</age>
17         <sex></sex>
18     </moniter>
19 </person>

js_text.html文件:网页中嵌入js代码进行测试,用浏览器打开此文件进行dtd文件的验证,这些代码不需要记住,只需会用即可。

 1 <html>
 2 <head>
 3 <meta http-equiv="content-type" content="text/html;charset=utf-8"/>
 4 </head>
 5 <script language="javascript">
 6 //从语法上分析:parse 
 7 //1.创建xml文档解析器对象
 8 var xmldoc =new ActiveXObject("Microsoft.XMLDOM");
 9 //2.开启xml校验
10 xmldoc.validateOnParse="true";
11 //3.装载xml文档
12 xmldoc.load("Person.xml");
13 //4.获取错误信息
14 var result=xmldoc.parseError.reason;
15 if(result!="")
16 {
17     document.write("错误信息:"+xmldoc.parseError.reason+"<br/>");
18     document.write("错误行数:"+xmldoc.parseError.line+"<br/>");
19 }
20 else
21 {
22     document.write("无错误信息!");
23 }
24 </script>
25 </html>
posted @ 2014-09-13 13:05  狂盗一枝梅  阅读(579)  评论(0编辑  收藏  举报