随笔分类 -  nutch

摘要:这里提供一些链接:http://blog.csdn.net/nutch_520/article/details/6203843http://blog.csdn.net/jiutao_tang/article/details/65243461. nutch的分页,search.jsp修改http://jingerjinger520.blog.163.com/blog/static/149305439201101153138548/2.关于nutch1.0二次开发需要更改的东西http://dev.firnow.com/course/3_program/java/javajs/20100719/4 阅读全文
posted @ 2012-06-19 10:41 editice 阅读(297) 评论(0) 推荐(0)
摘要:其实接触nutch实际上是因为我想做一个小百合的爬取搜集讲座信息的应用,对比了常见的crawler之后,最终还是选择了nutch,具体的对比我就在这不介绍了,不过不得不说nutch做的非常好。 nutch的安装,我直接将其安装在了我用作hadoop集群的机子上,系统环境:redhat server 6.0.然后我直接装上nutch 1.2解压缩即可使用。 阅读全文
posted @ 2011-12-22 18:20 editice 阅读(177) 评论(0) 推荐(0)