摘要: tar命令参数: -c 建立新的压缩文件 -v 显示指令执行过程 -f<备份文件> 指定压缩文件 -z 通过gzip指令处理压缩文件 -t 列出压缩文件中的内容 -x 表示解压tar -cvf 打包文件名 文件名 打包文件并指定打包之后的文件名(仅打包不压缩)tar -zcvf 压缩文件名 文件名/ 阅读全文
posted @ 2019-11-18 21:36 景、 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 什么是算子 在英文中被成为“Operation”,在数学上可以解释为一个函数空间到函数空间上的映射O:X->X,其实就是一个处理单元,往往是指一个函数,在使用算子时往往会有输入和输出,算子则完成相应数据的转化,比如:Group、Sort等都是算子。 流数据 在自然环境中,数据的产生原本就是流式的。但 阅读全文
posted @ 2022-11-03 15:43 景、 阅读(318) 评论(0) 推荐(0) 编辑
摘要: 1. Hive 表关联查询,如何解决数据倾斜的问题 1) 倾斜原因: map 输出数据按key Hash 的分配到reduce 中,由于key 分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce 上的数据量差异过大。 (1) key 分布不均匀; (2) 业务数据本身的特性; ( 阅读全文
posted @ 2022-07-13 22:00 景、 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2022-06-12 16:14 景、 阅读(13) 评论(0) 推荐(0) 编辑
摘要: -- 开窗 分组排序 -- row_number() over(partition by ... order by ...) 组内的排名序号 1 2 3 4 5 6 7 -- rank() over(partition by userid order by pv desc) 组内的排名序号 1 2 阅读全文
posted @ 2022-06-12 15:54 景、 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 1.在目录:/export/server/hadoop-3.1.4/etc/hadoop 下修改文件:hadoop-env.sh export HADOOP_CLIENT_OPTS="-Xmx2048m $HADOOP_CLIENT_OPTS" 分发给各个主机:scp hadoop-env.sh n 阅读全文
posted @ 2022-06-05 17:43 景、 阅读(139) 评论(0) 推荐(0) 编辑
摘要: Hadoop的key和value的传递序列化需要涉及两个重要的接口Writable和WritableComparable1.Writable: 重写write 和 readFields方法,负责读和写 2.WritableComparable 重写write、readFields 和 compare 阅读全文
posted @ 2022-05-27 10:49 景、 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 在Linux下输入ifconfig显示如下图: 解决方法如下: 1.输入 ifconfig ens33 up 执行之后输入ifconfig查看如下图: 2.执行如下命令: systemctl stop NetworkManager systemctl disable NetworkManager 3 阅读全文
posted @ 2022-05-15 14:36 景、 阅读(904) 评论(0) 推荐(0) 编辑
摘要: Znode有四种形式的目录节点(默认是persistent ) (1)持久化节点(PERSISTENT) 默认 create /node1 aaa 客户端与zookeeper断开连接后,该节点依旧存在 (2)持久化顺序节点(PERSISTENT_SEQUENTIAL) 创建zookeeper时会在路 阅读全文
posted @ 2022-04-16 21:29 景、 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 上传文件:zookeeper-3.4.8.tar.gz文件到安装目录下 /usr/local/tmp 解压文件: tar zxvf /usr/local/tmp/zookeeper-3.4.8.tar.gz 将解压文件复制到 /usr/local 下 cp -r zookeeper-3.4.8 .. 阅读全文
posted @ 2022-03-03 20:24 景、 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 请求:请求行 请求头 请求空行 请求体 请求方式:GET POST 只有POST请求有请求体(用来存放参数) 请求行:请求方式 提交路径(提交参数)HTTP/版本号 请求头: 请求空行:普通换行,用于区分请求头和请求体 请求体:只有POST提交方式才有请求体,用于显示提交参数 响应:响应行 响应头 阅读全文
posted @ 2021-12-24 13:05 景、 阅读(31) 评论(0) 推荐(0) 编辑