随笔分类 - nutch
摘要:这里提供一些链接:http://blog.csdn.net/nutch_520/article/details/6203843http://blog.csdn.net/jiutao_tang/article/details/65243461. nutch的分页,search.jsp修改http://jingerjinger520.blog.163.com/blog/static/149305439201101153138548/2.关于nutch1.0二次开发需要更改的东西http://dev.firnow.com/course/3_program/java/javajs/20100719/4
阅读全文
摘要:其实接触nutch实际上是因为我想做一个小百合的爬取搜集讲座信息的应用,对比了常见的crawler之后,最终还是选择了nutch,具体的对比我就在这不介绍了,不过不得不说nutch做的非常好。 nutch的安装,我直接将其安装在了我用作hadoop集群的机子上,系统环境:redhat server 6.0.然后我直接装上nutch 1.2解压缩即可使用。
阅读全文

浙公网安备 33010602011771号