2017 年 7月 14 日随笔档案 - fan-tastic

2017年7月14日

摘要：这里是通过爬取伯乐在线的全部文章为例子，让自己先对scrapy进行一个整理的理解该例子中的详细代码会放到我的github地址：https://github.com/pythonsite/spider/tree/master/jobboleSpider 注：这个文章并不会对详细的用法进行讲解，是为了阅读全文

posted @ 2017-07-14 23:10 fan-tastic 阅读(42497) 评论(1) 推荐(4) 编辑

爬虫性能相关

摘要：这里我们通过请求网页例子来一步步理解爬虫性能当我们有一个列表存放了一些url需要我们获取相关数据，我们首先想到的是循环简单的循环串行这一种方法相对来说是最慢的，因为一个一个循环，耗时是最长的，是所有的时间总和代码如下：通过线程池通过线程池的方式访问，这样整体的耗时是所有连接里耗时最久的那个阅读全文

posted @ 2017-07-14 16:25 fan-tastic 阅读(6660) 评论(7) 推荐(3) 编辑

公告