Terry's blog

Focus on bigdata and cloud.

博客园 首页 新随笔 联系 订阅 管理

2014年9月5日 #

摘要: 读取nutch内容有如下两种方法:1 通过Nutch apiSegmentReader读取。publicContentreadSegment(StringsegPath,Stringurl){ Textkey=newText(url);Pathpath=newPath(segPath);Conten... 阅读全文
posted @ 2014-09-05 10:00 王晓成 阅读(1099) 评论(0) 推荐(0) 编辑

摘要: 修改apache-tomcat-7.0.55\webapps\nutch-1.2下的cached.jsp将content = new String(bean.getContent(details))修改为content = new String(bean.getContent(details),"... 阅读全文
posted @ 2014-09-05 09:49 王晓成 阅读(318) 评论(0) 推荐(0) 编辑