摘要: 以伯乐在线文章为爬取目标blog.jobbole.com,发现在"最新文章"选项中可看到所有文章 一般来说,可以用scrapy中自带的xpath或者css来提取数据,定义在spiders/jobbole.py中的def parse(self, response) import scrapy clas 阅读全文
posted @ 2018-09-11 17:47 坚强的小蚂蚁 阅读(6707) 评论(0) 推荐(1)
摘要: 视频地址 https://coding.imooc.com/learn/list/92.html 一. 基础知识回顾 1. 正则表达式 1)贪婪匹配,非贪婪匹配 .*? 非贪婪 .* 贪婪模式 2)中括号的三种用法: 1[34578][0-9]{9} 使用"-"表示区间,写多个值表示取任一个值 [^ 阅读全文
posted @ 2018-09-11 17:40 坚强的小蚂蚁 阅读(390) 评论(0) 推荐(0)