会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Braveliberty
跟自己比,不要跟别人比
博客园
首页
新随笔
联系
管理
订阅
2017年5月17日
scrapy爬虫框架
摘要: downloader:负责下载html页面 spider:负责爬取页面内容,我们需要自己写爬取规则 srapy提供了selector,获取的方式有xpath,css,正则,extract item容器:spider获取到的内容放到item中 schedul:负责调度
阅读全文
posted @ 2017-05-17 16:27 Braveliberty
阅读(122)
评论(0)
推荐(0)
公告