上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页
摘要: 建表语句 ``` CREATE external TABLE `login_number`( serial_number string) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEP 阅读全文
posted @ 2023-08-03 15:02 whiteY 阅读(114) 评论(0) 推荐(0)
摘要: ###hive中分组排序过滤使用顺序。 ``` where,group by,having,order by同时使用,执行顺序为 (1)where过滤数据 (2)对筛选结果集group by分组 (3)对每个分组进行select查询,提取对应的列,有几组就执行几次 (4)再进行having筛选每组数 阅读全文
posted @ 2023-08-02 16:59 whiteY 阅读(306) 评论(0) 推荐(0)
摘要: 使用rpmrebuild 命令重新编辑rpm 包 ``` rpmrebuild -p -e seatunnel_3_1_4_0_315-2.3.1.3.1.4.0-315.x86_64.rpm ``` 编辑完成并保存重新生成repo源 ``` createrepo . ``` 清除缓存目录下的软件包 阅读全文
posted @ 2023-05-24 14:49 whiteY 阅读(477) 评论(0) 推荐(0)
摘要: ###1.spark-sql启动报错 java.lang.NoClassDefFoundError: org/apache/tez/dag/api/SessionNotRunning 原因:在启动时 找不到tez的jar包 解决方法:将tez目录下的tez-api-0.9.1.jar 复制一份到 s 阅读全文
posted @ 2023-05-11 15:04 whiteY 阅读(217) 评论(0) 推荐(0)
摘要: 使用spark-sql操作hive数据仓库的前提是需要把hive 配置文件hive-site.xml复制到spark conf目录下 进入到spark bin目录下使用命令开启一个spark-sql: ./spark-sql --master local[*] --jars /usr/hdp/cur 阅读全文
posted @ 2023-05-11 15:01 whiteY 阅读(165) 评论(0) 推荐(0)
摘要: 使用spark-shell操作hive数据仓库的前提是需要把hive 配置文件hive-site.xml复制到sparkconf目录下 进入到spark bin目录下使用命令开启一个spark-shell: ./spark-shell --master local[2] --jars /home/i 阅读全文
posted @ 2023-05-11 11:44 whiteY 阅读(97) 评论(0) 推荐(0)
摘要: README.md # how to use # 使用说明 ## 确认是否初始化完成, 当前yarn-session管理所有 《用户属性任务》 ## 任务名称为: bus_user_info_flinkjob path=`pwd` 00. 确认是否已经存在yarn session `shell ya 阅读全文
posted @ 2023-05-10 17:22 whiteY 阅读(247) 评论(0) 推荐(0)
摘要: ###解决办法 单播模式些特定环境下不允许发送组播,造成备服务器无法收到p包,就比如某些云服务器吧,默认会禁止组播。可以通过单播的方式解决. 单播示例配置: 注意此语法在keepalived1.2.11版本以上支持 unicast src ip 192.168.1.21### (本地IP地址) un 阅读全文
posted @ 2023-05-09 17:11 whiteY 阅读(128) 评论(0) 推荐(0)
摘要: ###notify.sh #!/bin/sh #########DESC########## #keepalive切换告警提示# ####################### ## 配置文件和手机号码配置 config_file="/etc/keepalived/hostinfo.cfg" ale 阅读全文
posted @ 2023-05-09 17:03 whiteY 阅读(225) 评论(0) 推荐(0)
摘要: ###1、HBase定义 HBase(Hadoop Database)是一个分布式、可扩展的NoSQL数据库。基于Big Table,为Hadoop框架当中的结构化数据提供存储服务,是面向列的分布式数据库。这一点与HDFS是不一样的,HDFS是分布式文件系统,管理的是存放在多个硬盘上的数据文件,不支 阅读全文
posted @ 2023-04-27 15:17 whiteY 阅读(136) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页