2017年9月9日

Spark计算均值

摘要: 用spark来快速计算分组的平均值,写法很便捷,话不多说上代码 用textFile读取数据后,以address进行分组来求age的平均值,这里用combineByKey来计算,这是一个抽象层次很高的函数.稍微总结一下自己的理解 查看源代码会发现combineByKey定义如下 combineByKe 阅读全文

posted @ 2017-09-09 15:21 kask 阅读(263) 评论(0) 推荐(0)

导航