摘要: 环境:win7+cygwin+hadoop-0.20.1伪分布式输入文件:一个125M的和一个几十K文本文件,运行时有3个map用eclipse运行wordcount程序,使用以下三种方式设置reduce个数均无效,始终只有一个reduce.通过job.setNumReduceTasks(2);设置hadoop安装目录conf/下的配置文件设置eclipse的hadoop插件的Advanced parameters中的mapred.reduce.tasks后来我将工程打包成jar(打包方法参考http://www.cnblogs.com/yejiurui/archive/2012/12/25/ 阅读全文
posted @ 2012-12-29 21:22 清澈如水_ 阅读(2851) 评论(1) 推荐(1)
摘要: 正则表达式概述1.1什么是正则表达式? 正则表达式(Regular Expression)起源于人类神经系统的早期研究。神经生理学家Warren McCulloch和Walter Pitts研究出一种使用数学方式描述神经网络的方法。1956年,数学家Stephen Kleene发表了一篇标题为“神经网事件的表示法”的论文,并在该论文中引入了"正则表达式"这一概念。 在正则表达式中,匹配是最常用的一个词语,它描述了正则表达式的工作结果。给定一段文本或字符串,可以使用正则表达式从文本或字符串中查找出符合正则表达式的字符串。有可能文本或字符串存在不止一个部分满足给定的正则表达式, 阅读全文
posted @ 2012-05-05 14:59 清澈如水_ 阅读(354) 评论(0) 推荐(0)