会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
私人小院
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
4
5
6
7
8
9
10
11
12
···
35
下一页
2022年3月27日
第五章_Spark核心编程_Rdd_转换算子_keyValue型_join&leftOuterJoin&rightOuterJoin&fullOuterJoin
摘要: 1. join /* * 1.定义 * def join[W](other: RDD[(K, W)]): RDD[(K, (V, W))] * def join[W](other: RDD[(K, W)], numPartitions: Int): RDD[(K, (V, W))] * 2.功能 *
阅读全文
posted @ 2022-03-27 08:22 学而不思则罔!
阅读(55)
评论(0)
推荐(0)
2022年3月26日
第五章_Spark核心编程_Rdd_转换算子_keyValue型_sortByKey
摘要: 1.定义 /* * 1.定义 * def sortByKey(ascending: Boolean = true, numPartitions: Int = self.partitions.length) * : RDD[(K, V)] = self.withScope * ascending :
阅读全文
posted @ 2022-03-26 09:18 学而不思则罔!
阅读(54)
评论(0)
推荐(0)
第五章_Spark核心编程_Rdd_转换算子_keyValue型_【思考】reduceByKey、flodByKey、aggregateByKey、combineByKey 的区别?
摘要: 1. 说明 /* * 思考 : * reduceByKey、flodByKey、aggregateByKey、combineByKey 的区别? * 本质区别 : Map端聚合和Reduce聚合规则是否相同,是不是要在Map的实现合并器 * * 1. reduceByKey * 1. 定义 * de
阅读全文
posted @ 2022-03-26 08:59 学而不思则罔!
阅读(109)
评论(0)
推荐(0)
2022年3月25日
第五章_Spark核心编程_Rdd_转换算子_keyValue型_combineByKey
摘要: 1. 定义 /* * 1. 定义 * def combineByKey[C](createCombiner: V => C, * mergeValue: (C, V) => C, * mergeCombiners: (C, C) => C, * numPartitions: Int): RDD[(K
阅读全文
posted @ 2022-03-25 19:55 学而不思则罔!
阅读(34)
评论(0)
推荐(0)
第五章_Spark核心编程_Rdd_转换算子_keyValue型_foldByKey
摘要: 1. 定义 /* * 1. 定义 * def foldByKey(zeroValue: V)(func: (V, V) => V): RDD[(K, V)] * def foldByKey(zeroValue: V,partitioner: Partitioner)(func: (V, V) =>
阅读全文
posted @ 2022-03-25 12:37 学而不思则罔!
阅读(37)
评论(0)
推荐(0)
第五章_Spark核心编程_Rdd_转换算子_keyValue型_aggregateByKey
摘要: 1. 定义 /* * 1. 定义 * def aggregateByKey[U: ClassTag](zeroValue: U, partitioner: Partitioner) * (seqOp: (U, V) => U,combOp: (U, U) => U): RDD[(K, U)] * *
阅读全文
posted @ 2022-03-25 12:19 学而不思则罔!
阅读(37)
评论(0)
推荐(0)
2022年3月24日
第五章_Spark核心编程_Rdd_转换算子_keyValue型_groupByKey
摘要: 1. 定义 /* * 1. 定义 * def groupByKey(): RDD[(K, Iterable[V])] * def groupByKey(partitioner: Partitioner): RDD[(K, Iterable[V])] * def groupByKey(numParti
阅读全文
posted @ 2022-03-24 21:42 学而不思则罔!
阅读(41)
评论(0)
推荐(0)
第五章_Spark核心编程_Rdd_转换算子_keyValue型_reduceByKey
摘要: 1. 定义 /* * 1. 定义 * def reduceByKey(func: (V, V) => V): RDD[(K, V)] * def reduceByKey(func: (V, V) => V, numPartitions: Int): RDD[(K, V)] * def reduceB
阅读全文
posted @ 2022-03-24 20:38 学而不思则罔!
阅读(59)
评论(0)
推荐(0)
2022年3月23日
第五章_Spark核心编程_Rdd_转换算子_keyValue型_partitionBy
摘要: 1. 定义 /* * 1. 定义 * def partitionBy(partitioner: Partitioner): RDD[(K, V)] * * 2. 功能 * 将数据类型为key-value的Rdd 按照指定 Partitioner 重新进行分区 * 默认分区器为 HashPartiti
阅读全文
posted @ 2022-03-23 19:52 学而不思则罔!
阅读(86)
评论(0)
推荐(0)
第五章_Spark核心编程_Rdd算子_转换算子_2value型_求交集&并集&差集&拉链_intersection&union&subtract&zip
摘要: 1. 求交集-intersection /* * 1. 定义 * def intersection(other: RDD[T]): RDD[T] * * 2. 功能 * 对源 RDD 和参数 RDD 求交集后返回一个新的 RDD * 参与运算的两个Rdd 类型必须一致,会对返回的结果进行去重 * *
阅读全文
posted @ 2022-03-23 17:38 学而不思则罔!
阅读(174)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
11
12
···
35
下一页
公告