xml

1.概念：Extensible Markup Language 可扩展标记语言

*可扩展：标签都是自定义的。

2.功能：

*存储数据：

1.配置文件

2.在网络中传输

3.xml与html的区别：

1.xml标签都是自定义的，html标签预定义

2.xml语言严格，html语法松散

3.xml是存储数据的，html是展示数据的

properties:

name=zhangsan

age=23

xml:

<name>zhangsan</name>

</user>

4.w3c：万维网联盟：

5.语法：

*基本语法：

1.xml的文档后缀名 .xml

2.文档第一行必须要文档声明

3.xml文档中有且仅有一个根标签

4.属性值必须使用引号引起来

5.标签必须正确关闭

6.xml标签名称区分大小写

*组成部分：

1.文档声明

1.格式<?xml 属性列表?>

*属性列表

1.version：版本号（必须属性）

2.encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：Iso-8859-1

3.standalone：是否独立

yes:不依赖其他文件

no：依赖其他文件

2.指令(了解):结合css

*<?xml-stylesheet type="text/css" href="a.css"?>

3.标签:标签名称自定义的

规则：

1.名称可以包含字母，数字以及其他的字符

2.名称不能以数字或者标点符号开始

3.名称不能以字母xml（或XML等等）开始

4.名称不能包含空格

4.属性：

id属性值唯一

5.文本：

CDATA区：在该区域中的数据会被原样展示

格式：<![CDATA[ 数据]]>

6.约束：规定xml文档的书写规则

*作为框架的使用者：

1.能够在xml中引用约束文档

2.能够简单读懂约束文档

*分类：

1.dtd：一种简单的约束技术

2.schema：一种复杂的约束技术

*dtd：

*引入dtd文档到xml文档中

*内部dtd：将约束规则定义在xml文档中

*外部dtd：将约束的规则定义在外部的dtd文件中

*本地：<!DOCTYPE 根标签名称 SYSTEM "dtd文件的位置">

*网络：<DOCTYPE 根标签名称 PUBLIC "dtd文件名字" "dtd文件的位置URL">

*schema：

7.解析：操作xml文档，将文档中数据读取到内存中

*操作xml文档

1.解析：将文档中的数据读取到内存中

2.写入：将内存中的数据保存到xml文档中，持久化存储

*解析xml的方式:

1.DOM:将标记语言文档一次性加载进内存，在内存中形成一颗dom树

*优点：操作方便，可以对文档进行CURD的所有操作

*缺点：消耗内存

2.SAX：逐行读取，基于事件驱动

*优点：不占内存

*缺点：只能读取，不能增删改

*xml常见的解析器：

1.jaxp：sun公司提供的解析器，支持dom和sax两种思想

2.dom4j：一款非常优秀的解析器

3.jsoup：一款解析html的解析器，也可以解析xml

4.pull：安卓系统内置解析器，sax方式的

*jsoup：

*快速入门：

*步骤：

1.导入jar包

2.获取document对象

3.获取对应的标签element对象

4.获取数据

public class Main {
    public static void main(String[] args) throws IOException {
        //2.获取document对象，根据一个xml文档来获取
        String path = Main.class.getClassLoader().getResource("student.xml").getPath();
        System.out.println(path);
        Document document = Jsoup.parse(new File(path));
        //3.获取元素
        Elements name = document.getElementsByTag("name");
        System.out.println(name.size());
        Element element = name.get(0);
        String name1 = element.text();
        System.out.println(name1);

    }
}

*对象的使用：

1.jsoup：工具类，可以解析html或者xml文档，返回document

2.document：文档对象

3.elements：元素element对象的集合

4.element：元素对象

5.node：节点对象

*快捷的查询方式：

1.selector：选择器

使用的方法：Element select（）

//根据name标签查询
Elements name = document.select("name");
System.out.println(name);
System.out.println("------------");
//获取id为1的值
Elements select = document.select("#1");
System.out.println(select);
System.out.println("------------");
//获取student标签并且number属性值为001的对象
Elements a = document.select("student[number=\"001\"]");
System.out.println(a);
//获取student标签并且number属性值为001的对象age子标签
Elements a1 = document.select("student[number=\"001\"] > age");
System.out.println(a1);

2.XPath：XPath即为xml路径语言，他是一种用来确定xml文档中某部分位置的语言

*使用Jsoup的Xpath需要导入jar包

*查询w3cshool参考手册，使用xpath语法完成查询

posted @ 2023-01-05 15:15 会秃头的小白阅读(51) 评论(0) 收藏举报

刷新页面返回顶部

lin513

xml

公告