随笔档案「2017年5月17日」：scrapy爬虫框架 ... - Braveliberty

摘要： downloader：负责下载html页面 spider：负责爬取页面内容，我们需要自己写爬取规则 srapy提供了selector，获取的方式有xpath，css，正则，extract item容器：spider获取到的内容放到item中 schedul：负责调度阅读全文

posted @ 2017-05-17 16:27 Braveliberty 阅读(124) 评论(0) 推荐(0)

Braveliberty