随笔分类 -  SQL逻辑

摘要:结论 当使用row_number()时,先确认key是否有重复,如果排序的键有重复,为了减少风险,建议使用rank dense_rank 代替 row_number() 相较于rank dense_rank 而言,对数目的编号存在随机性——当多条数目的key2相同时,则会随机给予数字编号顺序。 这直 阅读全文
posted @ 2022-02-28 11:03 riaris 阅读(121) 评论(0) 推荐(0)
摘要:结论 功能 count(col1, col2) 可以统计 多个字段的非空记录 要求 count()内含多个字段时,若有一个字段的记录为Null 则该条记录不会被统计 count()内含多个字段时,非sparksql引擎需要加distinct 字段限制 count()内含多个字段时,和以下语句不同 s 阅读全文
posted @ 2021-12-22 18:54 riaris 阅读(556) 评论(0) 推荐(0)
摘要:sql 中 Union相关说明 结论 Union & Union all: 功能:将两个要连接的 SQL 语句拼接在一起, 要求:字段个数一样(强制),字段类型一致(非强制)int→double→string 输出:以第一个表的列名作为输出表的列名 区别:union会对拼接结果去重,union al 阅读全文
posted @ 2021-12-01 11:33 riaris 阅读(1226) 评论(0) 推荐(0)
摘要:[Hive][COUNT] 使用count后出现null问题排查 问题概述 使用hive进行用户频次类数据分组提取时,最终的结果出现了全部为null的记录,同时也有全为0的记录,分析原因 v1HQL逻辑 with sup_tab as( 取出用户所用行为记录 ) select 用户id, count 阅读全文
posted @ 2021-10-31 14:07 riaris 阅读(762) 评论(0) 推荐(0)