摘要: 本人由守望者MS原创问题分析:最近在研究Nutch+hadoop。在unbutu server上部署了一套正式的程序,但是由于调试起来不方便,于是在本机上(windows Server 2003)采用cygwin模拟方式搭建了一个简单的Nutch1.2测试环境。根据配置方案,在cygwin中进行到:bin/nutch crawl url.txt –dir localweb –depth 2 –topN 100 –threads 2(注:参数可根据需求改写)命令时,cygwin提示JAVA_HOME not set.这个提示信息说明了本机的JAVA SDK的环境变量没有配置。(因为之前在本机一直 阅读全文
posted @ 2011-07-21 09:13 守望者MS 阅读(1714) 评论(0) 推荐(0) 编辑
摘要: 本文由守望者MS转载并测试 Gzip压缩是在Web服务器和浏览器间传输压缩文本内容的方法。Gzip压缩采用通用的压缩算法压缩HTML、JavaScript、CSS等静态文件和asp、aspx、php、jsp等动态文件。压缩的最大好处就是降低了网络传输的数据量,从而提高客户端浏览器的访问速度。当然,同时也会增加一点点服务器的负担。通过Windows2003系统设置的方式启用Gzip的突出优点就是效率... 阅读全文
posted @ 2011-07-21 08:39 守望者MS 阅读(352) 评论(0) 推荐(0) 编辑