Spark 2.x管理与开发-Spark SQL-Spark SQL基础 (四)DataFrame操作(2)在DataFrame中使用SQL语句

① 将DataFrame注册成表(视图):df.createOrReplaceTempView("emp")

② 执行查询:spark.sql("select * from emp").show

                            spark.sql("select * from emp where deptno=10").show

                            spark.sql("select deptno,sum(sal) from emp group by deptno").show

*************自己操作*************

注意:不能直接执行SQL语句,需要生成一个视图

 

 

 

count(1),其实就是计算一共有多少符合条件的行。

1并不是表示第一个字段,而是表示一个固定值。其实就可以想成表中有这么一个字段,这个字段就是固定值1。

count(1),就是计算一共有多少个1。

同理,count(2),也可以,得到的值完全一样,count('x'),count('y')都是可以的,返回的值完全是一样的,就是计数。

count(*),执行时会把星号翻译成字段的具体名字,效果也是一样的,不过多了一个翻译的动作,比固定值的方式效率稍微低一些。

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3