摘要:
一:Requests: 让 HTTP 服务人类 虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。 Requests 唯一的一个非转基因的 阅读全文
posted @ 2018-09-25 21:37
迎风而来
阅读(10250)
评论(0)
推荐(2)
摘要:
一.urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求。其常被用到的子模块在Python3中的为urllib.request和urllib.parse,在Python2中是urllib和urllib2。 二.由易到难的爬虫程序: 1.爬取百 阅读全文
posted @ 2018-09-25 20:20
迎风而来
阅读(1534)
评论(0)
推荐(2)
摘要:
一:HTTP和HTTPS HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法,以明文的形式传输,效率高,但是不安全 HTTPS(Hypertext Transfer Protocol over Secure Socket La 阅读全文
posted @ 2018-09-25 19:56
迎风而来
阅读(1773)
评论(0)
推荐(2)
摘要:
一、什么是爬虫 在学习爬虫之前我们科普一下什么是爬虫呢? 爬虫就是编写程序模拟浏览器上网,然后让其取互联网上抓取数据的过程 访问1个站点,获取该站点的html代码 解析html代码,把感兴趣的数据从html代码里分离出来 保存这些数据 二、哪些语言可以实现爬虫 1.php:可以实现爬虫。php被号称 阅读全文
posted @ 2018-09-25 19:14
迎风而来
阅读(484)
评论(0)
推荐(1)

浙公网安备 33010602011771号