XML 入门指导
1.XML文档的数据结构:是树状结构,相当于原来的层次型数据库系统。层次模型的主要优点是:数据模型比较简单,实体建的联系固定,具有良好的完整性支持,部门或分类性数据的描述直观。缺点是:插入和删除操作的限制较多,查询子节点必须通过父节点,不便于表示实际工作中的非层次数据。在层次模型中是使用节点表示记录的,每个节点表示一个记录类型,记录类型之间的联系用节点之间的连线表示,这个联系是父子之间的一对多联系。限制条件:a:有且仅有一个节点无双亲,这个节点称为根节点;b:其他节点有且仅有一个双亲节点。层次模型的结构就像一颗倒置的树,根节点以外的节点有且只有一个父节点。这也就使得层次数据库系统只能处理一对多的实体联系。
2.XML语法基本点:a:XML文档只能包含一个根元素。b:所有XML元素必须包含结束标记。c:元素的开始标记和结束标记的名称必须相同,XML区分大小写。d:XML元素不能重叠。e:所有的属性值必须使用引号——属性值必须用单引号或双引号括起来。
3.XML文档的结构:主要包含:序言码,处理指令PI,根元素,元素,属性,CDATA节和注释7部分。
a:序言码:包含XML声明(表明该文档是XML文档),处理指令(提供XML分析程序用于确定如何处理文档的信息),架构声明(确定用于验证文档是否为有效的XML文档)。如:
<?xml version="1.0" encoding="utf-8"?>
b:处理指令:用来给处理XML文档的应用程序提供信息的,XML分析器把这些信息原封不动的传给应用程序,有应用程序来解释这个指令,遵照它所提供的信息进行处理。处理指令的格式:<?处理指令名 处理指令信息?> 如:
<?xml-stylesheet type="text/xsl" href="book.xsl"?>
<?xml-stylesheet type="text/css" href="book.css"?>
c:根元素:是XML文档的主要部分,它包含文档的数据以及描述数据结构的信息。根元素中的信息存储在两种类型的XML 结构中:元素和属性。XML文档中使用的所有的元素和属性都嵌套在根元素中。如:
<document xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance%22%3E
</document>
d:元素:用与表示XML文档的结构和XML文档中包含的数据,由开始标记,内容,结束标记组成,没有内容的元素称为空元素,可以合并为一个标记。如:<sale/>
e:属性:是使用与特定的元素关联的对应“名称——值”的XML构造,包含在元素的开始标记中。
f:CDATA节:在CDATA标记下,所有的标记,实体应用都被忽略,而被XML处理程序当做字符数据看待。CDATA的形式如下:<![CDATA[文本内容]]> CDATA的文本内容不能出现字符串“]]>”,CDATA不能嵌套使用。
g:注释:以“<!--”开始,并以“-->”结束。
4.XML开发和应用环境:主要包括:XML编辑工具,验证工具,解析工具和浏览工具四项。
a:XML编辑工具:XMLwriter,XMLSpy等,
b:XML验证工具:Microsoft XML Validator和Microsoft XSL Debugger。
c:XML解析器 d:XML浏览工具:Microsoft XML Tree Viewer可以把XML文档的内容以树形结构的形式显示出来。
5.XML的相关技术:单纯的XML是用来描述数据的,如果不配合适当的样式表,在浏览时只能看到XML文档的树形结构,要验证XML文件是否正确合法就需要有DTD或XML Schema。在XML文件中要连接其他的资源,就需要使用XPath,XLink和XPointer等。
a:CSS是层叠样式表,不仅适用于HTML,也同样适用于XML。一个CSS样式表就是一系列的规则,每个规则说明XML元素如何显示。在XML中调用所要使用的样式表,则在WEB浏览器中打开该XML文件时,系统会根据CSS中所指定的排版样式来显示整份XML文件,将数据内容和数据显示完全分开,这样使XML文件更容易阅读。如果需要显示不同的排版格式,只需要套用不同的样式表即可,不必去更改整个XML文件。
b:XML DOM;DOM即Document Object Model,与HTML技术中的DOM概念相同,它把XML文档的内容实现为一个对象模型,简单的说就是应用程序如何访问XML文档。
c:XLink(XML Linking Language)允许用户用它来描述Web资源之间的链接关系。XLink不仅可以在XML文件之间建立链接,而且可以建立其他类型数据之间的链接。XML是结构化文件,这样使得借助文件结构进行内部定位称为可能,而无需对文本本身进行修改,这就是XPointer,用于在资源内定位,支持在XML文件中定位元素,属性,字符串等内部结构。XPath主要用于描述一个路径位置,而位置可以分为相对位置和绝对位置。一个相对位置路径事实上包含一连串的寻址步骤,每个寻址步骤是以斜线(/)进行分隔的。
6.XML文档内的名称空间:解决了同名标记的冲突问题,方便了不同范围,不同程序员的编程和应用。在介绍XML名称空间之前先看以下XML文档:
<?xml version="1.0" encoding="gb2312"?>
<bookinfo>
<title>三国演义</title>
<author>罗贯中</author>
<chapter>
<title>桃园豪杰三结义</title>
<para>话说天下大势,分久必合,合久必分。</para>
</chapter>
<chapter>
<title>何国舅谋诛宦竖</title>
<para>
且说董卓字仲颖,官拜河东太守,自来骄傲</para>
</chapter>
</bookinfo>
在这个XML文档中,第三行的元素title是表示书名,而第六行和第十二行的元素title表示的是章节名称,所以在应用程序在处理这个文件的过程中遇到title时,就需要判断它是书名呢还是章节名。这就产生了命名冲突问题。当在XML文档中存在多种元素需要使用相同的名称时,我们就需要使用命名空间。
浙公网安备 33010602011771号