RDD编程实践1-spark-shell交互式编程

spark-shell交互式编程:

根据某大学计算机系的成绩数据,完成编程,数据格式如下

 1.该系共有多少个学生:

首先新建RDD

 通过map函数与分割函数得到第一列数据作为新的RDD

 RDD去重

 行数

 2.该系共开设多少课程:

 3.求Tom同学的平均分:

通过filter函数进行筛选

 

 计算总数

 求平均数

 4.求每名同学的选修的课程门数:

 5.该系DataBase课程共有多少人选修:

 6.各门课程的平均分是多少:

 7.使用累加器计算共有多少人选了DataBase这门选修:

 

posted on 2020-02-14 16:22  宥宁  阅读(863)  评论(0编辑  收藏  举报

导航