(转)Scrapy学习笔记
摘要:
所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。不过由于一个网站的网页很多,而我们又不可能事先知道所有网页的URL地址,所以,如何保证我们抓取到了网站的所有HTML页面就是一个有待考究的问题了。一般的方法是,定义一个入口... 阅读全文
posted @ 2014-07-18 18:18
菜菜鸟向前进
阅读(254)
评论(0)
推荐(0)
浙公网安备 33010602011771号