会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
许新浩的博客
博客园
首页
新随笔
联系
订阅
管理
2023年10月27日
spark on k8s环境下不重新打镜像实现celeborn client或其他底层jar包升级
摘要: 博客园首发,转载请注明地址:https://www.cnblogs.com/tzxxh/p/17792469.html 前言 Apache Kyuubi 是一个分布式和多租户网关,用于在数据仓库和湖仓上提供无服务器 SQL。Apache Celeborn 是一个Remote Shuffle Serv
阅读全文
posted @ 2023-10-27 15:33 许新浩
阅读(403)
评论(3)
推荐(1)
2021年11月12日
Structured Streaming watermark总结
摘要: 博客园首发,转载请注明地址:https://www.cnblogs.com/tzxxh/p/15545264.html 上图来自官方文档中对于watermark的描述。 刚开始以为只要数据的event_time大于watermark时间,就会被处理,小于watermark就不会被处理。实际测试发现并
阅读全文
posted @ 2021-11-12 16:27 许新浩
阅读(162)
评论(0)
推荐(0)
2021年9月15日
CDH 5.13.3 内置hive1.1.0-cdh5.13.3 升级 hive 2.3.9
摘要: 博客园首发,转载请注明地址:https://www.cnblogs.com/tzxxh/p/15247833.html 原因:CDH 5.13.3默认的hive是 1.1.0版本,过于陈旧,不利于其他相关组件的升级,例如spark。CDH内进行hive版本升级,可以利用CDH进行hive日常运维。
阅读全文
posted @ 2021-09-15 09:23 许新浩
阅读(626)
评论(0)
推荐(0)
2020年3月3日
HDFS HA误删namenode后报错Nameservice testCluster has no SecondaryNameNode or High-Availability partner的恢复
摘要: 删除hdfs ha namenode的正常方式是先禁用高可用,今天想试试直接删除其中一个namenode,于是开始操作,结果剩下的NN无法启动。 cm页面报错:“Nameservice testCluster has no SecondaryNameNode or High-Availability
阅读全文
posted @ 2020-03-03 10:22 许新浩
阅读(1255)
评论(0)
推荐(0)
2019年1月14日
spark sql cache时发现的空字符串问题
摘要: 博客园首发,转帖请注明地址:https://www.cnblogs.com/tzxxh/p/10267202.html 图一 图1未做cache,直接过滤expression列的 null 和空字符串,可以看到结果符合预期。 图二 图2做了cache,再过滤expression列的 null 和空字
阅读全文
posted @ 2019-01-14 15:45 许新浩
阅读(829)
评论(0)
推荐(0)
2018年8月7日
centos7环境下ELK部署之elasticsearch
摘要: es部署:es只能用普通用户启动 博客园首发,转载请注明出处:https://www.cnblogs.com/tzxxh/p/9435318.html 一、环境准备: 安装jdk1.8、创建普通用户 二、安装: 方法一:tar包的形式 1.登陆普通用户 2.下载elasticsearch tar包
阅读全文
posted @ 2018-08-07 10:02 许新浩
阅读(270)
评论(0)
推荐(0)
2018年6月1日
CDH升级 5.7.5 --> 5.13.3(tar包方式)
摘要: 博客园首发,转载请注明出处:https://www.cnblogs.com/tzxxh/p/9123231.html 一、准备 1、关闭cdh中的服务 hdfs、yarn等所有服务;关闭 cm-server、cm-agent;备份cm元数据库。 2、下载 http://archive.clouder
阅读全文
posted @ 2018-06-01 19:51 许新浩
阅读(1896)
评论(19)
推荐(1)
CDH部署(以5.7.5为例)
摘要: 博客园首发,转载请注明出处https://www.cnblogs.com/tzxxh/p/9120020.html 一、准备工作(下面的内容括号内写master的表示仅在master节点执行,all代表所有节点都执行) 1、文件下载: http://archive.cloudera.com/cdh5
阅读全文
posted @ 2018-06-01 08:38 许新浩
阅读(457)
评论(1)
推荐(3)
公告