摘要:
HiveSQL 原理 join join 分为 MapJoin、ReduceJoin 两种,其中 MapJoin 思想是将小表存内存,然后大表分片,与小表完成连接操作。 MapJoin Map 阶段分为两个操作: 将小表数据读入内存,生成分片文件后存储到分布式存储系统中; 每个 Mapper 从分布 阅读全文
posted @ 2024-08-08 11:07
Stitches
阅读(115)
评论(0)
推荐(0)
摘要:
注意点 全局排序 OrderBy SELECT <select_expression>, <select_expression>, ... FROM <table_name> ORDER BY <col_name> [ASC|DESC] [,col_name [ASC|DESC], ...] Hiv 阅读全文
posted @ 2024-08-08 11:07
Stitches
阅读(42)
评论(0)
推荐(0)
摘要:
窗口函数 窗口函数可以更加灵活地对一定范围内的数据进行操作和分析,它能够为每行数据划分一个窗口,然后对窗口范围内的数据进行计算,最后将计算结果返回给该行数据; 举个例子,区别于 GroupBy,GroupBy 对分组范围内的数据进行聚合统计,得到当前分组的一条结果;窗口函数对每一条数据处理,展开一个 阅读全文
posted @ 2024-08-08 11:06
Stitches
阅读(400)
评论(0)
推荐(0)