nutch的安装、配置以及使用(学习笔记)

nutch版本1.7 solr版本4.6.0

-------------------------------------------------------------------------------------------------------------------------------------

nutch的安装

linux下的安装非常简单,直接从以下路径下载1.7的版本,解压以后即可

http://mirror.esocc.com/apache/nutch/

在windows下,你需要安装一个cygwin来模拟unix的环境,

从 http://www.cygwin.com/ 下载cygwin,基本按照默认安装即可,然后将nutch下载完解压以后放入cygwin/home/username/就可以了

你可以在nutch目录下使用bin/nutch来检验nutch是否安装正确

 注:nutch是java项目,所以需要jdk,我在cygwin下遇到了JAVA_HOME is not set. 但我的java环境变量是正确的。其实需要将java的环境变量设置为相对路径,问题就解决了,而且推荐将JDK的环境变量设置为相对路径。

如何设置jdk的环境变量 查看http://www.cnblogs.com/echofrank/p/3523133.html

在jdk配置正确之后,会出现错误 cygpath: can't convert empty path 这主要是因为java路径有空格的问题。解决方法如下:

---------------------------------------------------------------------------------------------------------------------------------------

posted on 2014-01-14 21:25  怕淹死的鱼  阅读(271)  评论(0)    收藏  举报

导航