2010-09-03 17:16 by Register, 339 visits, 网摘, 收藏, 编辑
摘要:1.安装JDK 62.安装Tomcat 6(安装目录避免空格出现)3.安装Cygwin 最新版4.安装Nutch 1.1 解压缩到Cygwin目录下apache-nutch-1.1目录5.配置Nutch文件nutch-site.xml(:后的反斜杠去掉)<configuration><property><name>http.agent.name</name...
阅读全文
2010-09-02 11:43 by Register, 9 visits, 网摘, 收藏, 编辑
摘要:职位:高级程序员工作地点:长春公司:本地一流企业,各种待遇齐全,如果能力过硬,有较大的薪资提升空间。要求:1、25-35岁,男性优先,全日制统招本科学历,计算机相关专业优先,三年以上开发经验; 2、掌握C/S及B/S平台的各2种以上软件开发技术,具备一定的UML基础知识,对UML的各种概念有一定的了解,知道各种模型图的大致概念和含义;3、精通Oracle/SQL-Server数据库,精通JAVA或...
阅读全文
2010-06-24 16:36 by Register, 980 visits, 网摘, 收藏, 编辑
摘要:上一篇简单叙述了使用正则表达式分割Apache日志文件中每条记录的信息,现在解决如何批量导入日志文件中的内容到SQL SERVER数据库。思路如下:1.利用SqlBulkCopy.WriteToServer(IDataReader reader)方法批量导入日志文件中的记录到SQL SERVER数据库。2.自定义的TxtDataReader类实现IDataReader接口用于传递给SqlBulkC...
阅读全文
2010-06-22 16:52 by Register, 395 visits, 网摘, 收藏, 编辑
摘要:使用正则表达式分隔Apache日志文件通用日志格式的Apache日志文件示例:127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326组合日志格式的Apache日志文件示例:127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apa...
阅读全文
2009-07-27 16:33 by Register, 782 visits, 网摘, 收藏, 编辑
摘要:本文是谷歌创始人Sergey和Larry在斯坦福大学计算机系读博士时的一篇论文。发表于1997年。在网络中并没有完整的中文译本,现将原文和本人翻译的寥寥几句和网络收集的片段(网友xfygx和雷声大雨点大的无私贡献)整理和综合到一起,翻译时借助了translate.google.com,因为是技术性的论文,文中有大量的合成的术语和较长的句子,有些进行了意译而非直译。 作为Google辉煌的起始,这篇...
阅读全文