• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
嘻哈•﹏•亻
博客园    首页    新随笔    联系   管理    订阅  订阅
Java 获取Html标签中各属性值

该方式适用于取任何标签的任何属性 只要对应替换标签名和属性。

public static String getImgStr(String htmlStr) {
  Set<String> pics = new HashSet<String>();
  String img = "";
  Pattern p_image;
  Matcher m_image;
  String regEx_img = "<audio.*attr\\s*=\\s*(.*?)[^>]*?>";
  p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
  m_image = p_image.matcher(htmlStr);
  while (m_image.find()) {
      // 得到<img />数据
      img = m_image.group();
      // 匹配<img>中的src数据
      Matcher m = Pattern.compile("attr\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
      while (m.find()) {
          pics.add(m.group(1));
      }
  }
  String str = pics.stream().collect(Collectors.joining());
  return str;
  }

posted on 2023-08-23 15:25  嘻哈•﹏•亻  阅读(69)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3