Spider & CrawlSpider

CrawlSpide 最重要的是分析源码
官方文档百度收搜
Spider document 就是官方文档了1.3的
源码分析
CrawlSpide 是爬取一个网站常用的规则 它是对spider进一步的包装 继承与spider
里面有一个很重要的类 叫做rules 实际上是可迭代的实际上是为了抽取信息用的
Spider

posted @ 2019-05-04 10:01  后山人  阅读(244)  评论(0编辑  收藏  举报