Spark 2.x管理与开发-Spark SQL-Spark SQL基础 (四)DataFrame操作(2)在DataFrame中使用SQL语句
Posted on 2020-07-19 14:50 MissRong 阅读(271) 评论(0) 收藏 举报Spark 2.x管理与开发-Spark SQL-Spark SQL基础 (四)DataFrame操作(2)在DataFrame中使用SQL语句
① 将DataFrame注册成表(视图):df.createOrReplaceTempView("emp")
② 执行查询:spark.sql("select * from emp").show
spark.sql("select * from emp where deptno=10").show
spark.sql("select deptno,sum(sal) from emp group by deptno").show
*************自己操作*************
注意:不能直接执行SQL语句,需要生成一个视图



count(1),其实就是计算一共有多少符合条件的行。
1并不是表示第一个字段,而是表示一个固定值。其实就可以想成表中有这么一个字段,这个字段就是固定值1。
count(1),就是计算一共有多少个1。
同理,count(2),也可以,得到的值完全一样,count('x'),count('y')都是可以的,返回的值完全是一样的,就是计数。
count(*),执行时会把星号翻译成字段的具体名字,效果也是一样的,不过多了一个翻译的动作,比固定值的方式效率稍微低一些。
浙公网安备 33010602011771号