摘要: 一.概述 在许多数据中,都存在类别的数据,在一些功能中需要根据类别分别获取前几或后几的数据,用于数据可视化或异常数据预警。在这种情况下,实现分组TopN就显得非常重要了,因此,使用了Spark聚合函数和排序算法实现了分布式TopN计算功能。 二.代码实现 1 package scala 2 3 im 阅读全文
posted @ 2019-11-20 19:22 云山之巅 阅读(2970) 评论(0) 推荐(0) 编辑