摘要: In this blog we will start with the basics on the data side and then move on to reporting, modeling, and data-mining. A good Data Warehouse is the first step towards a sustainable analytics initiativ... 阅读全文
posted @ 2010-04-07 20:51 Micah29 阅读(299) 评论(0) 推荐(0)
摘要: 今天晚上终于配好了Hadoop集群模式。首先,网上关于Hadoop配置集群模式的手册特别,每个人、每个人版本都有细微的差别。。对于像我这样的初学者,配环境的时候,有种不知所措的感觉。等配置,调试完后,才感觉其实大同小异,只要抓住核心的东西,其实差不多。建议建立一个链接指向要使用的hadoop版本,不妨设为hadoop[dbrg@dbrg-1:HadoopInstall]$ln -s hadoop0... 阅读全文
posted @ 2010-04-01 23:14 Micah29 阅读(838) 评论(0) 推荐(0)
摘要: 作者:马士华 发表于:2008-03-05 12:51 最后更新于:2008-03-25 11:18版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息。http://www.hadoop.org.cn/hadoop/hadoop-streaming/Michael G. Noll在他的Blog中提到如何在Hadoop中用Python编写MapReduce程序,韩国的goga... 阅读全文
posted @ 2010-03-25 16:18 Micah29 阅读(2176) 评论(0) 推荐(0)
摘要: 1. Hadoop各点之间的通信采用的是SSH,我们要采用免费的,所以用的是opnessh。但关于机制,现在还不明白。 如果连不通SSH2登录:现在确认能否不输入口令就用ssh登录localhost:$ ssh localhost如果不输入口令就无法用ssh登陆localhost,执行下面的命令:$ cd ~/.ssh2$ ssh-keygen2 -t rsa$ echo "IdKey id_rs... 阅读全文
posted @ 2010-03-25 16:16 Micah29 阅读(601) 评论(0) 推荐(0)