关于php/js抓取/采集

前段时间用php的一个插件(phpQuery+queryList)写了采集某个博客的一些博文,然后用linux的自动运行跑,感觉还不错。

但在很久之前就已经听说了另外一个插件,可以很好的进行采集,叫做casperJs(http://casperjs.org/),虽然没用过,但见过自己的导师用它来采集一些电商网站的信息,对于js后加载的数据一样有很好的支持,于是打算做个记录,有空再研究。

posted @ 2015-06-30 21:46  suhanyujie  阅读(241)  评论(0编辑  收藏  举报