摘要:
从hdfs上加载文件并创建graph scala> var graphs = GraphLoader.edgeListFile(sc,"/tmp/dataTest/graphTest.txt") graphs: org.apache.spark.graphx.Graph[Int,Int] = org 阅读全文
posted @ 2017-03-23 19:48
卖臭豆腐喽
阅读(1352)
评论(0)
推荐(0)
摘要:
(小案例,有五个人他们参见相亲节目,这个五个人分别是0,1,2,3,4,号选手,计算出追随者年龄大于被追随者年龄的人数和平均年龄) scala> import org.apache.spark._ import org.apache.spark._ scala> import org.apache. 阅读全文
posted @ 2017-03-23 19:48
卖臭豆腐喽
阅读(459)
评论(0)
推荐(0)
摘要:
ation算子通过sparkContext执行提交作业的runJob,触发rdd的DAG执行 (foreach) foreach(f) 会对rdd中的每个函数进行f操作,下面的f操作就是打印输出没有元素 saveAsTextFile foreach(f) 会对rdd中的每个函数进行f操作,下面的f操 阅读全文
posted @ 2017-03-23 19:24
卖臭豆腐喽
阅读(605)
评论(0)
推荐(0)
摘要:
transgormation的算子对key-value类型的数据有三种: (1)输入 与 输出为一对一关系 mapValue();针对key-value类型的数据并只对其中的value进行操作,不对key进行操作 (2)对单个rdd聚集 (2)对单个rdd聚集 combineByKey 相当于将(v 阅读全文
posted @ 2017-03-23 19:21
卖臭豆腐喽
阅读(716)
评论(0)
推荐(0)
摘要:
value类型的算子 处理数据类型为value型的算子(也就是这个算子只处理数据类型为value的数据),可以根据rdd的输入分区与输出分区的关系分为以下几个类型 (1)输入分区与输出分区一对一型 map型:对rdd的每个数据项,通过用户自定义的函数映射转换成一个新的rdd 上面4个方框表示4个rd 阅读全文
posted @ 2017-03-23 19:18
卖臭豆腐喽
阅读(2501)
评论(0)
推荐(0)

浙公网安备 33010602011771号