08 2022 档案
摘要:hs面试总结: 1 服务器传输命令 scp:远程文件拷贝程序,是secure copy program的的缩写 -r (递归) 2. 查看服务器运行情况以及cpu,运用哪个命令 top:查看服务器各个进程情况 df -h:linux查看系统内存(硬盘) 3.搭建hadoop生态圈,hadoop的搭建
阅读全文
摘要:TopN问题 需要确定使用什么排名函数,包含三种函数:row_number()、rank()、dense_rank() 每个班级的分数为前3名的学生 --建表语句 create table score(sid string, class string, score int) row format d
阅读全文
摘要:关于上调度的项目报错问题(虚拟机硬盘内存不够导致) 1 早上发现定时任务一直在转圈圈 2. 此时查看yarn中的状态 4.我们查看yarn的日志发现:磁盘的大小达到了总磁盘的 90% 使用 df -h 查看磁盘使用情况 ==5. 证明该加资源了==
阅读全文
摘要:mysql版本的行列转换 先看一个题目 ==方法:== 行转列 --我们可以使用union all函数 将其凭借起来 select ( case id when 1 then 'first' when 2 then 'second' when 5 then 'fifth' end)grade ,su
阅读全文
摘要:10、Flink join 1、Regular Joins 将两个关联表长存再状态中,可以一直关联上 会导致状态越来越大 和批处理关联结果是一样的 -- 创建学生表流表,数据再kafka中 drop table student_join; CREATE TABLE student_join ( id
阅读全文
摘要:8、优化 1、MiniBatch 聚合 flink默认是每一条数据都会取更新状态 MiniBatch :缓存一批数据一起更新状态,优点:增加吞吐量,缺点:增加延迟- 开启MiniBatch -- sql中开启 -- 开启 set table.exec.mini-batch.enabled=true;
阅读全文

浙公网安备 33010602011771号