摘要: 一直对爬虫耿耿于怀,今天总算是实现了,编写了一个Python Scrapy的爬虫获取果壳网首页的推荐文章。 打开果壳首页的一篇推荐文章,URL如下http://www.guokr.com/article/439791/可以看到果壳的文章都是在/article/下,并且所有文章是以6位数字表示,url问题解决了 下来是获取页面的标题,(图像使用的imgur的服务,国内可能需要多加载一段时间,... 阅读全文
posted @ 2015-02-15 13:45 zynick 阅读(329) 评论(0) 推荐(0)