摘要: 爬虫 ==> 高性能 阅读目录 一 背景知识 二 同步、异步、回调机制 三 高性能 一 背景知识 爬虫的本质就是一个socket客户端与服务端的通信过程,如果我们有多个url待爬取,只用一个线程且采用串行的方式执行,那只能等待爬取一个结束后才能继续下一个,效率会非常低。 需要强调的是:对于单线程下串 阅读全文
posted @ 2018-01-22 21:07 Aray007 阅读(126) 评论(0) 推荐(0)
摘要: 爬虫 ==》 同步调用 import requests def parse_page(res): print('PARSE %s' %(len(res))) def get_page(url): print('GET %s' %url) response=requests.get(url) if r 阅读全文
posted @ 2018-01-22 19:07 Aray007 阅读(190) 评论(0) 推荐(0)
摘要: asyncio模块 阅读全文
posted @ 2018-01-22 19:05 Aray007 阅读(142) 评论(0) 推荐(0)