【XML系列】-----XML文档格式(一)

XML文档的的分类:

 1.格式不良好的(malformed)的XML文档:完全没有遵循XML文档的基本规范的XML文档。

 2.格式良好(well-formed)但无效的XML文档:遵守了XML的基本规范,但没有使用DTD或schema定义语义约束的XML文档。

 3.有效(valid)的XML文档:遵守了XML文档的基本规范,并使用了DTD或schema的语义约束,并且遵守定义的语义约束的XML文档。

XML的语法:

       一个完整的XML文件应包含以下几个部分:

              -文档声明

              -元素

              -属性

              -注释

              -CDATA区、特殊字符

              -处理指令(processing instruction)

       文档声明:

              在编写XML文档时,需要先使用文档声明,声明XML文档的类型。

              例如:<?xml version=”1.0”?>

              用encoding属性说明文档的字符编码:

              例如:<?xml version=”1.0” encoding=”GB2312”?>

              用standalone属性说明文档是否独立(即是否引用其它资源):

              例如:

<?xml version=”1.0” encoding=”GB2312” standalone=”?>

       注:常见XML错误

           常见错误:

      1. <?xml version=1.0 ?>

      2. <?xml version=“1.0”?>

      3.编码错误

    常用的字符集:

      简体中文:GBK,GB2312

      繁体中文:BIG5

      西欧字符:ISO8859-1 

      通用的国际编码:Unicode,UTF-8

    XML本身保存的时候会有默认编码格式,请注意保存时的编码属性,否则会造成访问XML文件时出错。

XML元素的基本规则:

       元素是XML文档的基本单元,XML文档就是一个层层元素嵌套的元素组成的。整个XML文档从根元素开始,根元素包含若干个子元素,而每个子元素又可以包含多个子元素,从而可以组织成一个完整的XML文档。

      XML的标签分为两类:

              单标记:<br/>

              双标记:<p></p>

       XML标签要求:

 1.标签名可以有字母(包含非西欧字符)、数字、下划线、中划线、冒号和点组成,但不能以数字、中划线和点开头。

 2.标签名不能包含<>,$等

 3.标签名中尽量不要出现冒号,除了使用命名空间之外。

 4.标签名不能以xml、XML等任意大小写组合。

 5.标签名不能包含空格

 6.标签名区分大小写

XML标签嵌套子元素:

XML允许深度的嵌套子元素,但需要保证元素之间合理的嵌套,不能交叉嵌套即可,并且XML标签可以嵌套多个重名的子元素。

       <a>

              <b></b>

   </a>

对于空元素,它不可以接受子元素也不可以接受字符串内容,但它可以接受多个属性。

例如<con name=’bank’/>

       对于非空元素可以接受字符串,当标签内无内容时包含的是一个空格,空格也算字符。

       例如:<p></p> 这个时候P标签所包含的就是一个字符,

              <p>中国</p> 也可以这样包含字符串。

注:在格式良好的xml文档中有且只有一个根标签,且在XML文档中空格与换行符都当做标签内的内容来进行处理。

posted @ 2011-06-15 11:16  Laughing_Vzr@Stand By  阅读(5767)  评论(0编辑  收藏  举报