会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
青冥绿水
无冥冥之志者无昭昭之明,无惛惛之事者无赫赫之功
博客园
首页
新随笔
联系
订阅
管理
2021年2月19日
新手在使用 Spark RDD 获取排序后前 N 数据时遇到的一个坑
摘要: 在学习Spark的过程中,写程序统计单词数量的时候,突然想把统计后的(单词, 次数) 这样的集合根据各单词出现的次数从高到低倒序排列。于是在网上查了下有sortBy()函数可以实现。试了下没问题。然而由于单词过多,排序后打印出来的结果过长,于是想取前 10 条来验证,自然地想到使用top()函数,在
阅读全文
posted @ 2021-02-19 16:15 东围居士
阅读(1083)
评论(0)
推荐(0)
编辑
公告