摘要: --(1) 如何设置 开启Map输出阶段压缩 1. 开启hive 中间传输数据压缩功能set hive.exec.compress.intermediate=true;--2. 开启mr 中mapTask 输出结果压缩set mapreduce.map.output.compress=true;-- 阅读全文
posted @ 2022-02-07 19:29 学而不思则罔! 阅读(157) 评论(0) 推荐(0)
摘要: 1. 01 Map输出设置压缩 案例 package ComMapOutPk { import java.lang import org.apache.hadoop.conf.Configuration import org.apache.hadoop.fs.Path import org.apac 阅读全文
posted @ 2022-02-07 17:23 学而不思则罔! 阅读(55) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2022-02-07 16:05 学而不思则罔! 阅读(30) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2022-02-07 16:03 学而不思则罔! 阅读(44) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2022-02-07 16:03 学而不思则罔! 阅读(27) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2022-02-07 16:03 学而不思则罔! 阅读(30) 评论(0) 推荐(0)
摘要: 案例1-- 考查 :开窗聚合函数、开窗分区累加(order by)、获取当前记录的前一条数据(lag)、根据row_number将数据划分x等分(ntile) --1. 数据准备 --1. 数据准备 -- business.txt jack,2017-01-01,10 tony,2017-01-02 阅读全文
posted @ 2022-02-07 14:38 学而不思则罔! 阅读(73) 评论(0) 推荐(0)
摘要: 1. 开窗函数的作用 说明 : 开窗函数就是 根据指定的开窗规则 为表的每条记录,标记状态,不会增加或者减少表的记录数 2. 语法 分析函数、聚合函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置) 注意 : over(par 阅读全文
posted @ 2022-02-07 07:09 学而不思则罔! 阅读(420) 评论(0) 推荐(0)