xml解析器-Jsoup快速入门
xml解析器-Jsoup快速入门
步骤
- 导入依赖
- 获取Document对象
- 获取对应的标签Element对象
- 获取数据
依赖
<dependency> <!-- jsoup HTML parser library @ https://jsoup.org/ --> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.13.1</version> </dependency>
java代码
public static void main(String[] args) throws Exception { //获取student.xml的path String path = JsoupDemo01.class.getClassLoader().getResource("student.xml").toURI().getPath(); System.out.println(path); //获取Document对象 Document document = Jsoup.parse(new File(path), "utf-8"); //通过Document对象获取name标签,获取所有的name标签 Elements elements = document.getElementsByTag("name"); System.out.println(elements.size()); //通过Elements对象获取子标签对象 Element student = document.getElementsByTag("student").get(0); Elements name = student.getElementsByTag("name"); System.out.println(name.size()); String attr = student.attr("1"); System.out.println(attr); }
对象使用
- Jsoup:工具类 可以解析html或xml文档 返回Document
- parse:解析html或xml文档 返回Document
- parse(File in String charsetName):解析xml或html文件
- parse(String html):解析xml或html字符串
- parse(URL url,int timeoutMillis):通过网络路径获取指定html或xml的文档对象
- parse:解析html或xml文档 返回Document
- Document:文档对象 代码内存中的dom树
- Elements:元素Element对象的集合 可以当做ArrayList<Element>来使用
- Element:元素对象
- Node:节点对象
java代码
package com.bai.jsoup; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import java.io.File; import java.io.IOException; import java.net.URISyntaxException; public class JsoupDemo02 { public static void main(String[] args) throws URISyntaxException, IOException { String path = JsoupDemo02.class.getClassLoader().getResource("D:\\IDEAdaima\\day_01\\src\\main\\resources\\student.xml").getPath(); Document document = Jsoup.parse(new File(path), "utf-8"); System.out.println(document); } }
运行结果


浙公网安备 33010602011771号