spark - 从HDFS加载文件并分析

scala> val file=sc.textFile("/workspace/bpUserinfo_logs/bpUserinfo_20160212.log")  

scala> val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)  

scala> count.collect().map(print) 

posted @ 2016-02-16 14:25  LightingCui  阅读(1057)  评论(1编辑  收藏  举报