摘要:
(1)执行hadoopFile()操作,其中有生成HadoopRDD的new 方法。然后执行map方法。pair => pair._2.toString,只对Value值进行操作。在textFile操作中首先从文件系统中读取分布式数据,并且以数据分片的方式存在于集群之中,生成HadoopRDD,的类 阅读全文
posted @ 2016-01-27 23:50
hard-working
阅读(222)
评论(0)
推荐(0)
浙公网安备 33010602011771号