随笔分类 -  采集

鼓捣phantomjs(二) node.js模块化集成
摘要:著作权所有:http://www.cnblogs.com/zeusro/引用(爬虫)不给稿费的,切你jj追忆似屎年华在上一篇post(http://www.cnblogs.com/zeusro/p/4185196.html)里面,我留下了3个坑没有填平。2模块化加载到nodejs里面,用于批量采集。... 阅读全文
posted @ 2014-12-27 12:26 Cherbim 阅读(6415) 评论(2) 推荐(0)
鼓捣phantomjs,做ajax网站的信息采集
摘要:版权所有:http://www.cnblogs.com/zeusro/引用不给稿费的,切你jj准备工作:1phantomjs的安装2phantomjs环境变量的配置需求:采集手机淘宝某店铺的所有商品的ID难点:1页面是ajax的,不能用传统方法(webrequest,正则提取)提取数据,所以这才是我... 阅读全文
posted @ 2014-12-25 17:43 Cherbim 阅读(8587) 评论(11) 推荐(2)


这是页脚