随笔分类 -  爬虫

摘要:性能相关 在编写爬虫时,性能的消耗主要在IO请求中,当单进程单线程模式下请求URL时必然会引起等待,从而使得请求整体变慢。 import requests def fetch_async(url): response = requests.get(url) return response url_l 阅读全文
posted @ 2018-07-04 21:02 Carol-z 阅读(161) 评论(0) 推荐(0)
摘要:scrapy是一个大而全的爬虫组件 安装: - Win: 下载:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted pip3 install wheel pip install Twisted‑18.4.0‑cp36‑cp36m‑win_amd64. 阅读全文
posted @ 2018-06-27 18:44 Carol-z 阅读(126) 评论(0) 推荐(0)
摘要:requests Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 License 阅读全文
posted @ 2018-06-25 17:43 Carol-z 阅读(122) 评论(0) 推荐(0)