爬虫 基础

抓包:charles       Fiddler

HTTP请求处理,urllib、requests  专门获得网络连接的库

Scrapy框架:(Scrapy,Pyspider)
高定制性高性能(异步网络框架twisted),所以数据下载速度非常快,
提供了数据存储、数据下载、提取规则等组件

爬虫使用场景:通用爬虫、聚焦爬虫。

Ctrl + f        显示搜索框

Ctrl + p      可以查看构造request 请求方法时需要传递哪些参数

posted @ 2018-05-29 00:34  微微一笑、很倾城  阅读(124)  评论(0编辑  收藏  举报