摘要: 具体详细信息参见 http://webmagic.io/PageProcessor的实现: 实现PageProcessor接口即可。 在里面可以定制自己的爬虫规则Webmagic的页面抓取过程也就是PageProcessor分为三个部分: 1.设置抓取器的参数:如重复次数,重复事件等等 2.... 阅读全文
posted @ 2015-10-27 21:07 呵哦呵 阅读(683) 评论(0) 推荐(0)