会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
石云华
博客园
首页
新随笔
联系
订阅
管理
2026年4月
数据库集群中的bond1接口出现网络丢包
摘要: 1、故障概述OCP主机配置了NFS服务,通过万兆的bond1接口,将NFS共享给数据库集群中的所有节点。2025年12月开始,在数据库全备期间,OCP主机的bond1接口,经常出现网络丢包的告警信息。本文主要描述故障的分析过程,及给出相关的建议。 2、故障分析及解决过程 2.1 备份过程中,网络丢包
阅读全文
posted @ 2026-04-05 19:55 石云华
阅读(6)
评论(0)
推荐(0)
2026年3月
EM13告警:Metric evaluation error start - oracle.sysman.emSDK.agent.fetchlet.exception.FetchletException: Permission denied(publickey,password)
摘要: 1、故障概述 客户有一套EM13c的监控平台,目前存在一个意外事件:Metric evaluation error start - oracle.sysman.emSDK.agent.fetchlet.exception.FetchletException: Permission denied(pu
阅读全文
posted @ 2026-03-31 13:41 石云华
阅读(5)
评论(0)
推荐(0)
Exadata,更换完思科交换机后,与上联交换机无法通信
摘要: 1、故障概述 客户有一台Exadata X3-2,思科交换机出现故障,管理网络中断。更换完思科交换机,并且按照官方手册中的步骤重新配置完Exadata内置的思科交换机后,该Exadata内部的所有节点都可以正常通信,但与上联交换机无法通信。本文主要介绍其中的原因,以及解决办法。 2、故障处理 2.1
阅读全文
posted @ 2026-03-29 19:30 石云华
阅读(10)
评论(0)
推荐(0)
Exadata更换计算节点的硬盘
摘要: 1、案例概述 客户的Exadata X3-2,机房巡检时,发现第二台计算节点有个硬盘亮黄灯告警。本文简要记录处理过程。 2、处理过程 2.1 登录第二台计算节点,查看硬盘状态。 [root@ex01db02 ~]# dbmcli -e list physicaldisk 252:0 CUSE5F n
阅读全文
posted @ 2026-03-20 19:03 石云华
阅读(10)
评论(0)
推荐(0)
Exalogic虚拟机的网络无法启动,提示Device has different MAC address than expected
摘要: 1、故障概述 客户的一台Exalogic,ZFS存储的一个机头出现了主板故障。为了保险起见,客户选择了停止业务,停止Exalogic上所有的虚拟机,以及虚拟环境控制台,最后再进行主板更换。 当天晚上,硬件工程师更换完主板,ZFS存储恢复正常,但在启动Exalogic虚拟环境时,问题出现了,有两台虚拟
阅读全文
posted @ 2026-03-12 08:45 石云华
阅读(6)
评论(0)
推荐(0)
2026年2月
单个ASM磁盘free空间为0,导致rebalance时提示“ASM磁盘组空间耗尽(ORA-15041)”
摘要: 1、故障概述 一套11gR2的RAC环境,磁盘组的剩余空间非常充足,但是,当某块ASM磁盘损坏后,在rebalance的过程中,提示“ASM磁盘组空间耗尽(ORA-15041)”。 2、故障分析及处理 2.1 查看ASM磁盘情况,具体信息如下所示。 NAME DISK_NUMBER PATH TOT
阅读全文
posted @ 2026-02-28 22:29 石云华
阅读(11)
评论(0)
推荐(0)
Exadata的思科交换机,重启后进入到了rommon模式
摘要: 1、故障概述 客户有一台Exadata X3-2,断电重启后,发现思科交换机无法访问,通过串口线登录思科交换机,发现思科交换机进入到了rommon模式。 本文主要记录该故障的处理过程。 2、故障处理 2.1 通过串口线登录思科交换机,发现思科交换机进入到了rommon模式,具体信息如下。 *****
阅读全文
posted @ 2026-02-23 16:27 石云华
阅读(24)
评论(0)
推荐(0)
2026年1月
SYSAUX表空间中的SYS.EXP_HEAD$表,占用大量空间
摘要: 1、案例概述 客户有一套19C的CDB环境,其中一个PDB的SYSAUX表空间的空间使用竟然高达80GB左右。在以前的认知中,SYSAUX表空间最多只有十几个GB,是什么东西占用了这么大的空间呢,想弄个明白。 2、案例分析 2.1 运行awrinfo.sql脚本,先找出是哪些对象占用空间,信息如下所
阅读全文
posted @ 2026-01-22 08:28 石云华
阅读(31)
评论(0)
推荐(0)
PX并行进程产生大量的trace日志,导致文件系统撑爆
摘要: 1、故障概述 客户的一套ORACLE数据库,版本为19.23,由于PX并行进程产生大量的trace日志,导致文件系统被撑爆。本文主要分析为什么会产生如此大的trace日志文件,并给出相应的解决方案。 2、故障分析 2.1 文件系统被撑爆时,客户检查了该文件系统的空间占用情况,发现是ORACLE数据库
阅读全文
posted @ 2026-01-08 15:58 石云华
阅读(17)
评论(0)
推荐(0)
2025年12月
回收站存在大量对象,导致Insert into...select语句夯住
摘要: 1、故障概述 客户打电话反馈Exadata上的某个PDB数据库,昨天晚上业务系统出现hang的现象,最终重启PDB后,业务系统慢慢恢复正常。 本文主要进行故障原因分析以及给出解决方案。 2、故障分析过程 (1).让客户收集了故障时间段的AWR报告和ASH报告。 截取故障时间段的部分AWR内容如下:
阅读全文
posted @ 2025-12-31 20:28 石云华
阅读(23)
评论(0)
推荐(0)
下一页
公告