会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
打不死的流云
博客园
首页
新随笔
联系
订阅
管理
2016年7月21日
Python爬虫Scrapy框架入门(3)
摘要: 往往需要爬取的网页是呈一个树状结构。比如,需要先爬取一个目录,然后再在目录中选择具体的爬取目标。而目录和具体目标之间,网页结构不同,使得我们不能使用相同的爬取策略。 从之前的经验来看,我们对scrapy进行操作是从Spider的Parse()函数作为入口。不如在parse()函数中对对目录进行操作,
阅读全文
posted @ 2016-07-21 22:20 打不死的流云
阅读(437)
评论(0)
推荐(0)
公告