摘要: scrapy是个好玩的爬虫框架,基本用法就是:输入起始的一堆url,让爬虫去get这些网页,然后parse页面,获取自己喜欢的东西。。用上去有django的感觉,有settings,有field。还会自动生成一堆东西。。用法:scrapy-admin.py startproject abc 生成一个project。 试试就知道会生成什么东西。在spiders包中新建一个py文件,里面写自定义的爬虫类。自定义爬虫类必须有变量domain_name和start_urls,和实例方法parse(self,response)..它会在 Scrapy 查找我们的spider 的时候实例化,并自动被 Sc 阅读全文
posted @ 2013-09-13 21:40 Come~on! 阅读(6237) 评论(0) 推荐(0) 编辑