XML、java解释XML、XML约束

1.XML有什么用？

（1）可以用来保存数据

（2）可以用来做配置文件

（3）数据传输载体

2.XML格式

XML 元素必须遵循以下命名规则：

名称可以含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能以字符 “xml”（或者 XML、Xml）开始
名称不能包含空格

元素分为简单元素与复杂元素：

简单元素：元素里面包含了普通的文字

复杂元素：元素里面还可以嵌套其他的元素

示例：

<?xml version="1.0" encoding="utf-8"?>
<stus>
    <stu id="100">
        <name>张三</name>
        <age>13</age>
    </stu>
    <stu id="101">
        <name>李四</name>
        <age>14</age>
    </stu>
</stus>

3.CDATA区

如果某段字符串里面有过多的字符，并且里面包含了类似标签或者关键字的这种文字，不想让xml的解析器去解析。那么可以使用CDATA来包装。

CDATA区段开始于"<![CDATA["，结束于"]]>"。

示例：

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <stus>
 3     <stu id="100">
 4         <name>张三</name>
 5         <age>13</age>
 6         <search><![CDATA[<a href="http://www.baidu.com">百度</a>]]></search>
 7     </stu>
 8     <stu id="101">
 9         <name>李四</name>
10         <age>14</age>
11     </stu>
12 </stus>

4.JAVA解析XML

解析，就是把xml里面的文本数据提取出来。

XML解析有很多种方式，比较常用的有两种，分别是DOM和SAX。

两者的区别如下：

针对上面两种解析，有一些公司给出了JAVA的解决方案，例如jaxp，jdom，dom4j。用的比较多的是dom4j。

先要下载jar包进行导入，附上官网地址：https://dom4j.github.io/

这里用的是dom4j-1.6.1.jar。

5.DOM4j的基本使用

public static void main(String[] args) throws DocumentException {
        // 创建sax读取对象
        SAXReader reader = new SAXReader();
        // 指定解析的xml源
        Document document = reader.read(new File("src/com/pr/xml/students.xml"));
        // 得到根元素
        Element rootElement = document.getRootElement();
        // 获取元素的名字getName()
        System.out.println(rootElement.getName());
        // 获取根元素下的stu元素
        System.out.println(rootElement.element("stu").getName());
        // 获取stu元素下的name元素
        System.out.println(rootElement.element("stu").element("name").getName());
        // 获取name元素的文本getText()
        System.out.println(rootElement.element("stu").element("name").getText());
    }

这样子只能获取一个学生的全部信息，如果需要遍历全部：

public static void main(String[] args) throws DocumentException {
        // 创建sax读取对象
        SAXReader reader = new SAXReader();
        // 指定解析的xml源
        Document document = reader.read(new File("src/com/pr/xml/students.xml"));
        // 得到根元素
        Element rootElement = document.getRootElement();

        // 得到根元素下一层级的所有元素，也就是两个stu
        List<Element> list = rootElement.elements();
        for (Element element:list) {
            String name = element.element("name").getText();
            String age = element.element("age").getText();
            System.out.println(name + ":" + age);
        }
    }

6.DOM4j的XPath使用

（1）首先添加jar包依赖：https://mvnrepository.com/artifact/jaxen/jaxen

这里用的是：jaxen-1.1.1.jar

（2）知道XPath怎么用，具体可以看看W3C

示例代码：

public static void main(String[] args) throws DocumentException {
        // 创建sax读取对象
        SAXReader reader = new SAXReader();
        // 指定解析的xml源
        Document document = reader.read(new File("src/com/pr/xml/students.xml"));
        // 得到根元素
        Element rootElement = document.getRootElement();

        // selectSingleNode获取的是第一个，只返回一个
        Element nameElement = (Element) rootElement.selectSingleNode("//name");
        System.out.println(nameElement.getText());

        // 获取xml里面的所有name元素
        List<Element> list = rootElement.selectNodes("//name");
        for (Element element:list) {
            System.out.println(element.getText());
        }

    }

7.XML约束

如下的文档，属性的ID值是一样的。这在生活中是不可能出现的。并且第二个学生的姓名有好几个。一般也很少。那么怎么规定ID的值唯一，或者是元素只能出现一次，不能出现多次？甚至是规定里面只能出现具体的元素名字。

    <stus>
        <stu id="10086">
            <name>张三</name>
            <age>18</age>
            <address>深圳</address>
        </stu>
        <stu id="10086">
            <name>李四</name>
            <name>李五</name>
            <name>李六</name>
            <age>28</age>
            <address>北京</address>
        </stu>
    </stus>

XML的约束有两种方式：DTD(.dtd)与Schema(.xsd)

DTD：语法自成一派，早起就出现的。可读性比较差。

Schema：其实就是一个xml ，使用xml的语法规则， xml解析器解析起来比较方便，是为了替代DTD 。
但是Schema 约束文本内容比DTD的内容还要多。所以目前也没有真正意义上的替代DTD

（1）DTD的基本格式

示例：

    <!ELEMENT stus (stu)>  : stus 下面有一个元素 stu  ， 但是只有一个
    <!ELEMENT stu (name , age)>  stu下面有两个元素 name  ,age  顺序必须name-age
    <!ELEMENT name (#PCDATA)> 
    <!ELEMENT age (#PCDATA)>
    <!ATTLIST stu id CDATA #IMPLIED> stu有一个属性 文本类型， 该属性可有可无

（2）DTD的引入

1. 引入网络上的DTD

   <!-- 引入dtd 来约束这个xml -->

          <!--    文档类型  根标签名字 网络上的dtd   dtd的名称   dtd的路径

          <!DOCTYPE stus PUBLIC "//UNKNOWN/" "unknown.dtd"> -->

2. 引入本地的DTD

      <!-- 引入本地的DTD  ： 根标签名字 引入本地的DTD  dtd的位置 -->
      <!-- <!DOCTYPE stus SYSTEM "stus.dtd"> -->

3. 直接在XML里面嵌入DTD的约束规则

   <!-- xml文档里面直接嵌入DTD的约束法则 -->

          <!DOCTYPE stus [
              <!ELEMENT stus (stu)>
              <!ELEMENT stu (name,age)>
              <!ELEMENT name (#PCDATA)>
              <!ELEMENT age (#PCDATA)>
          ]>

          <stus>
              <stu>
                  <name>张三</name>
                  <age>18</age>
              </stu>
          </stus>

Schema

（1）Schema的基本格式

示例：

    <!-- xmlns  :  xml namespace : 名称空间 /  命名空间
    targetNamespace :  目标名称空间 。 下面定义的那些元素都与这个名称空间绑定上。 
    elementFormDefault ： 元素的格式化情况。  -->
    <schema xmlns="http://www.w3.org/2001/XMLSchema" 
        targetNamespace="http://www.w3.org/teacher" 
        elementFormDefault="qualified">
        
        <element name="teachers">
            <complexType>
                <sequence maxOccurs="unbounded">
                    <!-- 这是一个复杂元素 -->
                    <element name="teacher">
                        <complexType>
                            <sequence>
                                <!-- 以下两个是简单元素 -->
                                <element name="name" type="string"></element>
                                <element name="age" type="int"></element>
                            </sequence>
                        </complexType>
                    </element>
                </sequence>
            </complexType>
        </element>
    </schema>

实例文档：
    <?xml version="1.0" encoding="UTF-8"?>
    <!-- xmlns:xsi : 这里必须是这样的写法，也就是这个值已经固定了。
    xmlns : 这里是名称空间，也固定了，写的是schema里面的顶部目标名称空间
    xsi:schemaLocation : 有两段： 前半段是名称空间，也是目标空间的值 ， 后面是约束文档的路径。
     -->
    <teachers
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http://www.w3.org/teacher"
        xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd"
    >
        <teacher>
            <name>zhangsan</name>
            <age>19</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
    </teachers>

（2）名称空间的作用

一个xml如果想指定它的约束规则，假设使用的是DTD ，那么这个xml只能指定一个DTD ，不能指定多个DTD 。但是如果一个xml的约束是定义在schema里面，并且是多个schema，那么是可以的。简单的说：一个xml 可以引用多个schema约束。但是只能引用一个DTD约束。

名称空间的作用就是在写元素的时候，可以指定该元素使用的是哪一套约束规则。默认情况下，如果只有一套规则，那么都可以这么写

<teachers xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xmlns:aa="http://www.w3.org/teacher" 
xmlns:bb="http://www.w3.org/teacher"
xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd" >
<name>张三</name>

<aa:name></aa:name>
<bb:name></bb:name>

posted @ 2019-01-22 20:30 苦瓜爆炒牛肉阅读(496) 评论(0) 收藏举报

刷新页面返回顶部

苦瓜爆炒牛肉