xml解析器-Jsoup快速入门

步骤

导入依赖
获取Document对象
获取对应的标签Element对象
获取数据

依赖

<dependency>
      <!-- jsoup HTML parser library @ https://jsoup.org/ -->
      <groupId>org.jsoup</groupId>
      <artifactId>jsoup</artifactId>
      <version>1.13.1</version>
</dependency>

java代码

  public static void main(String[] args) throws Exception {
        //获取student.xml的path
        String path = JsoupDemo01.class.getClassLoader().getResource("student.xml").toURI().getPath();
        System.out.println(path);
        //获取Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");
        //通过Document对象获取name标签，获取所有的name标签
        Elements elements = document.getElementsByTag("name");
        System.out.println(elements.size());
        //通过Elements对象获取子标签对象
        Element student = document.getElementsByTag("student").get(0);
        Elements name = student.getElementsByTag("name");
        System.out.println(name.size());

        String attr = student.attr("1");
        System.out.println(attr);
    }

对象使用

Jsoup:工具类可以解析html或xml文档返回Document
- parse:解析html或xml文档返回Document
  - parse(File in String charsetName):解析xml或html文件
  - parse(String html):解析xml或html字符串
  - parse(URL url,int timeoutMillis):通过网络路径获取指定html或xml的文档对象　　
Document:文档对象代码内存中的dom树
Elements：元素Element对象的集合可以当做ArrayList<Element>来使用
Element:元素对象
Node:节点对象

java代码

package com.bai.jsoup;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

import java.io.File;
import java.io.IOException;
import java.net.URISyntaxException;

public class JsoupDemo02 {
    public static void main(String[] args) throws URISyntaxException, IOException {
        String path = JsoupDemo02.class.getClassLoader().getResource("D:\\IDEAdaima\\day_01\\src\\main\\resources\\student.xml").getPath();
        Document document = Jsoup.parse(new File(path), "utf-8");
        System.out.println(document);
    }

}

运行结果

posted @ 2022-08-07 19:08 baimingze 阅读(157) 评论(0) 收藏举报

刷新页面返回顶部

aimz01

xml解析器-Jsoup快速入门

xml解析器-Jsoup快速入门

公告