摘要:        
前两篇文章介绍了Hadoop Streaming框架的使用方法。由于篇幅所限,并没有介绍其中的高级使用方法,但是有一些用法还是相当常见的。今天对一些高级用法进行一个简单的说明,希望能给大家一些启发。 1 使用cacheFile分发文件 如果文件(如字典文件)存放在HDFS中,希望计算时在每个计算节点上将文件当作本地文件处理,,可以使用-cacheFile hdfs://host:port/path/to/file#linkname选项在计算节点缓存文件,Streaming程序通过./linkname访问文件。 例如: hadoop = `which hadoop` $hadoop...    阅读全文
        
            posted @ 2013-03-04 20:41
百小度治哥
阅读(439)
评论(0)
推荐(0)
        
     
                    
                 
 浙公网安备 33010602011771号
浙公网安备 33010602011771号