会员
周边
新闻
博问
融资
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
COREY
博客园
首页
新随笔
联系
订阅
管理
2018年11月29日
关于深度优先和广度优先
摘要: 在爬虫系统中,待抓取URL队列是很重要的一部分,待抓取URL队列中的URL以什么样的顺序排队列也是一个很重要的问题,因为这涉及到先抓取哪个页面,后抓取哪个页面。而决定这些URL排列顺序的方法,叫做抓取策略。下面是常用的两种策略:深度优先、广度优先 scrapy框架默认的是深度优先算法 深度优先与广度
阅读全文
posted @ 2018-11-29 10:39 Corey0606
阅读(329)
评论(0)
推荐(0)
编辑
公告