Python爬虫系列(一):从零开始,安装环境

在上一个系列,我们学会使用rabbitmq。本来接着是把公司的celery分享出来,但是定睛一看,celery4.0已经不再支持Windows。公司也逐步放弃了服役多年的celery项目。恰好,公司找人进来新人也要给他们培训爬虫。接下来,我们就从零开始,学习爬虫,目标是能掌握到执行js,反爬虫这个水平,做一般的商业爬虫没问题。牛小妹,接下来要仔细看了哦。

软件环境:

python 3.6.3:不必说

beautifulsoup4:pip install beautifulsoup4 用来解析HTML

requests2.18:pip install requests 用来请求网页

网上,还大量有urllib,urllib2等玩意,我一一尝试。最后信了这个:

事实却是如此。

接下来,我们将用request获取网页。。。。。。

posted @ 2017-10-18 22:26  逆风飞行  阅读(794)  评论(0编辑  收藏  举报