会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
业余砖家
没有比人更高的山,没有比脚更长的路。
新随笔
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
44
下一页
2025年3月24日
大数据Java开发中常见的报错
摘要: 以下是一些 大数据Java开发 中常见的实际报错案例及解决方案,结合典型场景(如Hadoop、Spark、Flink等框架)说明: 案例1:HDFS文件写入权限不足 报错信息:org.apache.hadoop.security.AccessControlException: Permi
阅读全文
posted @ 2025-03-24 15:39 业余砖家
阅读(62)
评论(0)
推荐(0)
2025年3月21日
HBase 常见故障与解决方案
摘要: 1. RegionServer 宕机 现象:RegionServer 进程异常退出,日志提示 ABORTING region server 或 long garbage collecting pause。 原因: 内存不足:堆内存耗尽或 Full GC 时间过长。 磁盘 I/O
阅读全文
posted @ 2025-03-21 11:28 业余砖家
阅读(238)
评论(0)
推荐(0)
HDFS 常见故障与解决方案
摘要: 1. NameNode 元数据丢失或损坏 现象:NameNode 无法启动,报错提示元数据文件缺失或校验失败。 原因:误删元数据目录(dfs.name.dir)或多次格式化导致 namespaceID 不一致。 解决: 从 SecondaryNameNode 或备份的元数据目录(n
阅读全文
posted @ 2025-03-21 11:21 业余砖家
阅读(331)
评论(0)
推荐(0)
HDFS 进入安全模式(SafeMode)的场景
摘要: 一、被动触发(HDFS 自动进入) NameNode 启动阶段 元数据加载:NameNode 启动时需加载元数据(镜像文件 fsimage 和编辑日志 edits),此时自动进入安全模式,直到元数据加载完成并完成完整性校验。 DataNode 注册:DataNode 启动后向 Nam
阅读全文
posted @ 2025-03-21 10:56 业余砖家
阅读(281)
评论(0)
推荐(0)
Hive CLI 与 Beeline 的区别
摘要: 1. 架构与连接方式 对比项Hive CLIBeeline 服务依赖 直接访问 Metastore,无需启动额外服务 需依赖 HiveServer2(HS2)服务 通信协议 本地模式(无网络协议) 基于 JDBC/ODBC 协议,支持远程连接 客户端类型 单机客户端
阅读全文
posted @ 2025-03-21 10:20 业余砖家
阅读(128)
评论(0)
推荐(0)
2025年3月20日
CDH中对Hadoop进行扩容的步骤
摘要: 一、添加新节点(横向扩容) 新节点基础配置 网络与主机名:修改新节点的IP地址和主机名,确保与集群其他节点在同一网络并更新所有节点的/etc/hosts文件。 防火墙设置:关闭防火墙、禁止防火墙开机自启。 SSH免密登录:生成新节点的SSH密钥并分发到NameNode,确保集群节点
阅读全文
posted @ 2025-03-20 11:06 业余砖家
阅读(200)
评论(0)
推荐(0)
2025年3月19日
如何确定 Kafka 的 Leader 节点?
摘要: 一、命令行工具查询 使用 kafka-topics.sh 查看分区 Leader # 列出所有主题及其分区的 Leader 信息 bin/kafka-topics.sh --describe --bootstrap-server <Broker地址> --topic <主题名> 输出示例:
阅读全文
posted @ 2025-03-19 16:05 业余砖家
阅读(248)
评论(0)
推荐(0)
Kafka 常见故障及解决方案
摘要: 1. Broker 无法启动 原因: 端口被占用(默认 9092)或配置错误(如 server.properties 路径不可写)。 ZooKeeper 连接失败(地址配置错误或 ZooKeeper 服务未启动)。 解决: 检查端口占用:使用 netstat -tuln | grep
阅读全文
posted @ 2025-03-19 15:52 业余砖家
阅读(927)
评论(0)
推荐(0)
HBase RegionServer 宕机原因及解决方案
摘要: 一、核心原因与对应解决方案 JVM Full GC 异常 原因:长时间 Full GC 导致 RegionServer 停顿(常见于堆内存管理不当或 JVM 参数配置不合理)。 解决: 优化 JVM 参数,如调整 CMS/ParNew 垃圾回收器参数,避免频繁 Full GC。
阅读全文
posted @ 2025-03-19 15:10 业余砖家
阅读(175)
评论(0)
推荐(0)
Hadoop 使用 DistCp 跨集群迁移数据的完整指南
摘要: 一、DistCp 核心原理与适用场景 原理:DistCp 是 Hadoop 提供的分布式文件复制工具,基于 MapReduce 实现跨集群或集群内数据的高效复制,支持大规模数据迁移和增量同步。 适用场景: 集群升级或迁移(如从本地集群迁移至云集群)。 数据备份与容灾(跨机房或跨地域复制)。
阅读全文
posted @ 2025-03-19 14:16 业余砖家
阅读(769)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
44
下一页
公告