07 2011 档案

摘要:前言:作者(守望者MS)在实际搭建并开发Nutch的过程中参阅很多中文资料,但内容并不详尽且有错误,于是在此记录个人实战过程,纠正一些文章错误,以详细的过程展现一次简单的二次开发流程,为初学者降低门槛。但不能保证完全没有错误,如有发现希望大家指正。 目录: 1.Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境的搭建 2.Nutch1.2二次开发详细攻略... 阅读全文
posted @ 2011-07-28 11:37 守望者MS 阅读(4505) 评论(11) 推荐(1)
摘要:前言:作者(守望者MS)在实际搭建并开发Nutch的过程中参阅很多中文资料,但内容并不详尽且有错误,于是在此记录个人实战过程,纠正一些文章错误,以详细的过程展现一次简单的二次开发流程,为初学者降低门槛。但不能保证完全没有错误,如有发现希望大家指正。 目录: 1.Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境的搭建 2.Nutch1.2二次开发详细攻略... 阅读全文
posted @ 2011-07-27 16:32 守望者MS 阅读(4229) 评论(14) 推荐(0)
摘要:前言:作者(守望者MS)在实际搭建并开发Nutch的过程中参阅很多中文资料,但内容并不详尽且有错误,于是在此记录个人实战过程,纠正一些文章错误,以详细的过程展现一次简单的二次开发流程,为初学者降低门槛。但不能保证完全没有错误,如有发现希望大家指正。 目录: 1.Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境的搭建 2.Nutch1.2二次开发详细攻略... 阅读全文
posted @ 2011-07-27 15:17 守望者MS 阅读(4899) 评论(15) 推荐(2)
摘要:前言:作者(守望者MS)在实际搭建并开发Nutch的过程中参阅很多中文资料,但内容并不详尽且有错误,于是在此记录个人实战过程,纠正一些文章错误,以详细的过程展现一次简单的二次开发流程,为初学者降低门槛。但不能保证完全没有错误,如有发现希望大家指正。 本文出自 “守望者MS” 博客,谢绝转载! 目录: 1.Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境... 阅读全文
posted @ 2011-07-27 15:12 守望者MS 阅读(3735) 评论(1) 推荐(0)
摘要:本人由守望者MS原创问题分析:最近在研究Nutch+hadoop。在unbutu server上部署了一套正式的程序,但是由于调试起来不方便,于是在本机上(windows Server 2003)采用cygwin模拟方式搭建了一个简单的Nutch1.2测试环境。根据配置方案,在cygwin中进行到:bin/nutch crawl url.txt –dir localweb –depth 2 –topN 100 –threads 2(注:参数可根据需求改写)命令时,cygwin提示JAVA_HOME not set.这个提示信息说明了本机的JAVA SDK的环境变量没有配置。(因为之前在本机一直 阅读全文
posted @ 2011-07-21 09:13 守望者MS 阅读(1737) 评论(0) 推荐(0)
摘要:本文由守望者MS转载并测试 Gzip压缩是在Web服务器和浏览器间传输压缩文本内容的方法。Gzip压缩采用通用的压缩算法压缩HTML、JavaScript、CSS等静态文件和asp、aspx、php、jsp等动态文件。压缩的最大好处就是降低了网络传输的数据量,从而提高客户端浏览器的访问速度。当然,同时也会增加一点点服务器的负担。通过Windows2003系统设置的方式启用Gzip的突出优点就是效率... 阅读全文
posted @ 2011-07-21 08:39 守望者MS 阅读(373) 评论(0) 推荐(0)
摘要:分不清天黑了还是天亮了 徘徊在寂寞中 静悄悄踱着... 回忆那年的夏 暖风吹拂我们的脸庞柠檬的香味 伴着青草的羞涩 淡淡的 甜甜的 轻咬一下 变甜了那夏美妙的时光 走着,走着 迈过了岁月的步伐忽然抬头看啊天空中那带彩绸 优美 细柔 纵身一拮 散落成飘零的红叶 飞舞... 阅读全文
posted @ 2011-07-16 01:32 守望者MS 阅读(181) 评论(0) 推荐(0)
摘要:本文由守望者MS整理1. 运行Nutch程序报错如下:Exception in thread "main" java.io.IOException: Cannot run program "chmod": CreateProcess error=2解决方法: 只需要把cygwin的bin目录加到windows的用户环境变量中就可以了,然后需要重启eclipse 阅读全文
posted @ 2011-07-15 13:23 守望者MS 阅读(649) 评论(2) 推荐(0)
摘要:本文由守望者MS转载并整理注:全文分两部分,第一部分为英文配置方案,第二部分为中文配置方案。推荐按照英文的步骤去做,中文的少了cygwin的步骤,在以后的操作中会出现一点问题,解决方案会在另一篇文章中贴出来。第一部分This is a work in progress. If you find errors or would like to improve this page, just create an account [UserPreferences] and start editing this pageTested withNutch release 1.0Eclipse 3.3 ( 阅读全文
posted @ 2011-07-15 13:21 守望者MS 阅读(1360) 评论(1) 推荐(0)
摘要:本文由守望者MS原创1.cls 清屏2.rem 注释3.echo 显示消息,回显4.@ 以行尾单位控制命令的回显方式5.title 设置命令shell的窗口的标题栏6.color 设置命令shell窗口使用的文本色和背景色 第一个数字代表背景色 第二个数字代表文件颜色7.有些字符是命令行的保留字符,包括@、《、》、&、|、^等字符。在使用这些字符的时候,需要使用转码字符^对其进行转换。例如: 2&3=5 应该为 2^&=5对例子中的变量值进行回显时,会发生一些奇怪的现象,例如看到的等式不同,或者得到出错信息,如果想要将变量值设置为包含特殊字符,同时又可以将该值向用户显示 阅读全文
posted @ 2011-07-14 17:43 守望者MS 阅读(316) 评论(0) 推荐(0)
摘要:本文由守望者MS原创有两种方式解决这个问题1.下载软件解密http://soft.rubypdf.com/softwares/pdfcrypt(下载地址)如果你懒得下载,可以试试在线解密2.在线解密http://www.freemypdf.com/ (用IE会好点,用其他解密完成下载的时候有时基本没速度,或者提示下载失败) 阅读全文
posted @ 2011-07-14 14:27 守望者MS 阅读(3865) 评论(0) 推荐(0)
摘要:本文由守望者MS转载在我们平时写程序的时候,有些参数是经常改变的,而这种改变不是我们预知的。比如说我们开发了一个操作数据库的模块,在开发的时候我们连接本地的数据库那么 IP ,数据库名称,表名称,数据库主机等信息是我们本地的,要使得这个操作数据的模块具有通用性,那么以上信息就不能写死在程序里。通常我们的做法是用配置文件来解决。 各种语言都有自己所支持的配置文件类型。比如 Python ,他支持 .ini 文件。因为他内部有一个 ConfigParser 类来支持 .ini 文件的读写,根据该类提供的方法程序员可以自由的来操作 .ini 文件。而在 Java 中, Java 支持的是 .prop 阅读全文
posted @ 2011-07-10 18:20 守望者MS 阅读(586) 评论(0) 推荐(0)