会员
周边
新闻
博问
融资
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
柒禾
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2020年11月20日
学爬虫前必备知识-数据提取(xpath)
摘要: xpath解析 最常用且最便捷高效的一种解析方式。通用性强。 xpath解析原理 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中。 调用etree对象中的xpath方法,结合者xpath表达式实现标签的定位和内容的捕获。 环境安装 pip install lxml 实例化一个
阅读全文
posted @ 2020-11-20 22:37 路神
阅读(148)
评论(0)
推荐(0)
编辑
学爬虫前必备知识-数据提取(正则RE)
摘要: 正则表达式 01_元字符 量词功能 * (贪婪) 重复零次或更多 + (懒惰) 重复一次或更多次 ? (占有) 重复零次或者一次 {n} 重复n次 {n, m} 重复n,m次 {n,} 重复n次或者更多次 [abc] 字符组 匹配包含括号内元素的字符 02_几种反义 反义功能 \W 匹配任意不是字母
阅读全文
posted @ 2020-11-20 21:55 路神
阅读(126)
评论(0)
推荐(0)
编辑