摘要:
1,正则解析:就是通过正则匹配定位到要获取数据的标签,获取响应的数据 直接上代码(以爬取糗事百科为例) 2,xpath的表达式:是一种用来定位标签的层级关系的一中表达式 xpath表达式的要点: 代码中xpath表达式进行数据解析: 下载:pip install lxml 导包: from lxml 阅读全文
posted @ 2019-01-28 21:01
帅爆太阳的男人
阅读(3792)
评论(0)
推荐(0)
摘要:
一:urllib库: urllib是Python自带的一个用于爬虫的库,器主要作用就是可以通过代码模拟浏览器发送请求.其被用到子模块在Python3中的urllib.request和urllib.parse,在Python2中是urllib和urllib2. 二,有易到难的爬虫程序: 爬取到百度页面 阅读全文
posted @ 2019-01-28 21:00
帅爆太阳的男人
阅读(376)
评论(0)
推荐(0)
摘要:
1,requests的get请求的发送 什么是requests模块:requests模块是Python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求.功能强大,用简洁高效的语言,在爬虫领域占据着半壁江山的位置 requests向比较与urllib的request的极大优势: 不用手动 阅读全文
posted @ 2019-01-28 21:00
帅爆太阳的男人
阅读(458)
评论(0)
推荐(0)
浙公网安备 33010602011771号