会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kafka
2017年9月9日
Spark计算均值
摘要: 用spark来快速计算分组的平均值,写法很便捷,话不多说上代码 用textFile读取数据后,以address进行分组来求age的平均值,这里用combineByKey来计算,这是一个抽象层次很高的函数.稍微总结一下自己的理解 查看源代码会发现combineByKey定义如下 combineByKe
阅读全文
posted @ 2017-09-09 15:21 kask
阅读(263)
评论(0)
推荐(0)
导航
博客园
首页
新随笔
联系
订阅
管理
公告