• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






柒禾

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2020年11月20日

学爬虫前必备知识-数据提取(xpath)
摘要: xpath解析 最常用且最便捷高效的一种解析方式。通用性强。 xpath解析原理 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中。 调用etree对象中的xpath方法,结合者xpath表达式实现标签的定位和内容的捕获。 环境安装 pip install lxml 实例化一个 阅读全文
posted @ 2020-11-20 22:37 路神 阅读(173) 评论(0) 推荐(0)
 
学爬虫前必备知识-数据提取(正则RE)
摘要: 正则表达式 01_元字符 量词功能 * (贪婪) 重复零次或更多 + (懒惰) 重复一次或更多次 ? (占有) 重复零次或者一次 {n} 重复n次 {n, m} 重复n,m次 {n,} 重复n次或者更多次 [abc] 字符组 匹配包含括号内元素的字符 02_几种反义 反义功能 \W 匹配任意不是字母 阅读全文
posted @ 2020-11-20 21:55 路神 阅读(149) 评论(0) 推荐(0)