| | | |

2020年11月20日

摘要： xpath解析最常用且最便捷高效的一种解析方式。通用性强。 xpath解析原理实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中。调用etree对象中的xpath方法，结合者xpath表达式实现标签的定位和内容的捕获。环境安装 pip install lxml 实例化一个阅读全文

posted @ 2020-11-20 22:37 路神阅读(185) 评论(0) 推荐(0)

学爬虫前必备知识-数据提取（正则RE）

摘要：正则表达式 01_元字符量词功能 * （贪婪）重复零次或更多 + （懒惰）重复一次或更多次？（占有）重复零次或者一次 {n} 重复n次 {n, m} 重复n,m次 {n,} 重复n次或者更多次 [abc] 字符组匹配包含括号内元素的字符 02_几种反义反义功能 \W 匹配任意不是字母阅读全文

posted @ 2020-11-20 21:55 路神阅读(149) 评论(0) 推荐(0)