摘要:
一直对爬虫耿耿于怀,今天总算是实现了,编写了一个Python Scrapy的爬虫获取果壳网首页的推荐文章。 打开果壳首页的一篇推荐文章,URL如下http://www.guokr.com/article/439791/可以看到果壳的文章都是在/article/下,并且所有文章是以6位数字表示,url问题解决了 下来是获取页面的标题,(图像使用的imgur的服务,国内可能需要多加载一段时间,... 阅读全文
posted @ 2015-02-15 13:45
zynick
阅读(329)
评论(0)
推荐(0)

浙公网安备 33010602011771号