2018年5月10日

爬虫之Scrapy

摘要: wus点我 Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates W 阅读全文

posted @ 2018-05-10 23:24 王大拿 阅读(584) 评论(0) 推荐(0)

爬虫值解决效率问题的方法

摘要: 1 本质: 方案: 多进程 > 多线程 > 单线程 本质: 问题内容:阻塞 解决方案 异步非阻塞 用基本的代码实现异步非阻塞 1. 什么是协程? - 是“微线程”,不存在;是由程序员人为创造出来并控制程序:先执行某段代码、再跳到某处执行某段代码。 - 如果遇到非IO请求来回切换:性能更低。 - 如果 阅读全文

posted @ 2018-05-10 22:58 王大拿 阅读(572) 评论(0) 推荐(0)

回调函数的意义以及python实现

摘要: 回调函数(callback),百度百科的解释是这样的: 回调函数就是一个通过函数指针调用的函数。如果你把函数的指针(地址)作为参数传递给另一个函数,当这个指针被用来调用其所指向的函数时,我们就说这是回调函数。回调函数不是由该函数的实现方直接调用,而是在特定的事件或条件发生时由另外的一方调用的,用于对 阅读全文

posted @ 2018-05-10 14:58 王大拿 阅读(266) 评论(0) 推荐(0)

导航