摘要: 一、背景 客户生产环境数据量比较大的时候,有一个存储过程作业需要执行22min左右,这个作业经常出现数据库作业已经执行完毕,而大数据平台还显示正在执行中的问题。导致整个业务流程无法顺利完成。 二、原因探究 2.1 原因分析 由于oracle的存储过程使用的是jdbc的statement.execut 阅读全文
posted @ 2022-05-05 20:01 虎啸千峰 阅读(1339) 评论(0) 推荐(0) 编辑
摘要: 一、 背景 客户现场的CDH6.x版本的集群执行一个大分区表时hiveserver2发生了内存溢出。下面针对该问题进行了复现并深入了解了hiveserver2内存加载使用原理;提出了解决此类问题的方案,具体内容如下。 二、HiveServer2内存溢出 2.1查看表文件个数 desc formatt 阅读全文
posted @ 2022-05-05 19:53 虎啸千峰 阅读(909) 评论(0) 推荐(0) 编辑
摘要: 一、背景 2019 年,Cloudera 与 Hortonworks 合并后,彻底完成了转型。Cloudera 果断宣布,对 CDH 和 HDP 两条产品线将仅支持到 2022 年。对于两个产品高度重合的部分会做删减和融合,结果就是推出新的数据平台 CDP (Cloudera Data Platfo 阅读全文
posted @ 2022-05-05 19:43 虎啸千峰 阅读(1654) 评论(0) 推荐(0) 编辑
摘要: 一、背景 作为大数据常用的组件Hive,其在执行作业异常时会返回一些错误码。但是,hive返回的错误概括性比较强,往往看不出来具体的信息,需要进入到集群中查看详细的yarn执行日志或者hiveserver2的日志才能定位出具体的原因。 本文针对客户生产环境中常见的Hive返回的错误码进行释义,并提出 阅读全文
posted @ 2022-05-05 19:39 虎啸千峰 阅读(1184) 评论(0) 推荐(0) 编辑
摘要: 1 本地源配置 服务器本地源没有配置,导致不能连接外网,参考其他可以连接外网的服务器,配置本地源。配置方法: 1.1打开CentOS.repo文件并修改 Vi /etc/yum.repos.d/CentOS.repo 1.2增加yum配置 [base] name=CentOS-$releasever 阅读全文
posted @ 2022-05-05 19:32 虎啸千峰 阅读(360) 评论(0) 推荐(0) 编辑