代码改变世界

随笔分类 - A故障处理专题

案例:是谁用了我的临时表空间?

2019-11-18 23:54 by AlfredZhao, 60 阅读, 收藏, 编辑
摘要:环境:RHEL 6.5 + Oracle 11.2.0.4 RAC + ADG 起初发现自己的ADG测试环境不再同步,进一步分析是DATA磁盘组空间耗尽导致的,可是最近在磁盘组上的数据库都没有做过什么测试,且测试磁盘组一直都留有2G+剩余空间,那是什么导致突然没空间了呢? 经过查询dba_data_ 阅读全文

ASH裸数据dba_hist_active_sess_history的分析

2019-09-04 01:01 by AlfredZhao, 107 阅读, 收藏, 编辑
摘要:之前在一则案例《 "记录一则enq: TX row lock contention的分析过程" 》使用过这种方法。 因为最近故障处理经常会用到这类查询进行ASH裸数据的分析,下面以m_ash0902为命名,时间为:2019 09 02 16:00:00 2019 09 02 18:00:00,方便根 阅读全文

Oracle创建新undo表空间最佳实践(包含段检查)

2019-04-18 05:50 by AlfredZhao, 191 阅读, 收藏, 编辑
摘要:在处理一则ORA 600 [4194]案例时,参考MOS文档:Step by step to resolve ORA 600 4194 4193 4197 on database crash (文档 ID 1428786.1) "1.对于ORA 600[4194]的解释" "2.创建新undo表空间 阅读全文

定位amdu无法使用的根因并解决

2018-12-10 22:47 by AlfredZhao, 128 阅读, 收藏, 编辑
摘要:环境: OEL 5.7 + Oracle 10g + amdu_X86 64 现象: 我的两套实验环境,一套单实例,一套RAC,操作系统都是OEL 5.7,数据库都是Oracle 10g,上传同样的amdu介质。一个正常,一个报错: 直接去网上或是MOS搜索,都没有相关匹配的文章。 从报错本身来看就 阅读全文

记录一则expdp任务异常处理案例

2018-11-01 23:20 by AlfredZhao, 271 阅读, 收藏, 编辑
摘要:环境: AIX 6.1 + Oracle 10.2.0.4 现象: 在XTTS迁移测试阶段,遇到执行几个expdp的导出任务,迟迟没有返回任何信息,对应日志无任何输出,查看任务状态: 可以看到所有的expdp导出任务的STATE都停留在DEFINING状态。 "1.牛刀小试清异常" "2.追本溯源查 阅读全文

记录一则ORA-600 [13011]错误

2018-07-13 10:05 by AlfredZhao, 222 阅读, 收藏, 编辑
摘要:环境: Solaris 10 + Oracle 11.2.0.1 现象: alert告警日志定期出现ORA 600 [13011]错误 "1.故障现象" "2.初步分析" "3.匹配MOS" "4.定位解决" 1.故障现象 数据库alert 日志: 2.初步分析 从/u01/app/oracle/d 阅读全文

HP-UX平台Oracle启动实例遭遇:ORA-27154,ORA-27300,ORA-27301,ORA-27302

2018-06-02 09:01 by AlfredZhao, 528 阅读, 收藏, 编辑
摘要:环境: HP UX 11.31 + Oracle 11.2.0.4 现象: 在hpux安装Oracle,按业务需求配置参数后,无法启动实例。 报错如下: "1.初步定位" "2.验证猜想" "3.深入分析" 1.初步定位 快速判定这是实例就无法启动,也就是nomount这一阶段就无法成功,首先想到的 阅读全文

Oracle 重建控制文件一例

2018-05-23 09:57 by AlfredZhao, 2516 阅读, 收藏, 编辑
摘要:环境: OEL 5.7 + Oracle 10.2.0.5 背景: 在Oracle的运维过程中,时常会遇到一些场景是需要重建控制文件才可以解决的。本文的场景可以通过复制控制文件到新路径,运行一段时间后,再用老的控制文件启动数据库重现。 "1.当前故障现象" "2.分析故障原因" "3.重建控制文件" 阅读全文

Oracle RAC环境下定位并杀掉最终阻塞的会话-续

2018-04-21 08:47 by AlfredZhao, 585 阅读, 收藏, 编辑
摘要:之前在《 "Oracle RAC环境下定位并杀掉最终阻塞的会话" 》中,最终使用一个SQL查询出RAC实例之间的所有阻塞关系。但是实际在某些极端的生产环境,是不允许执行复杂的SQL语句,即使允许执行可能现场也不方便复制SQL,手敲的话效率低下,那么本文就介绍另一种简单的方法来快速定位最终阻塞会话,也 阅读全文

Oracle RAC环境下定位并杀掉最终阻塞的会话

2018-04-04 16:29 by AlfredZhao, 1105 阅读, 收藏, 编辑
摘要:实验环境: Oracle RAC 11.2.0.4 (2节点) "1.模拟故障:会话被级联阻塞" "2.常规方法:梳理找出最终阻塞会话" "3.改进方法:立即找出最终阻塞会话" 之前其实也写过一篇相关文章: "如何定位Oracle数据库被锁阻塞会话的根源" 但上文给出的例子过于简单,实际对于生产中复 阅读全文

记录一则ASM实例阻塞,rbal进程异常的案例

2018-03-27 10:56 by AlfredZhao, 518 阅读, 收藏, 编辑
摘要:"1.故障现象描述" "2.确认故障现象" "3.排查ASM层面" "4.解决问题" 1.故障现象描述 环境: AIX 7.1 + Standalone Oracle 11.2.0.4 现象: 客户反映某11g版本的ADG备库无法正常进行任何查询,数据库alert发现ORA 00494:enqueu 阅读全文

记录一则enq: TX - row lock contention的分析过程

2018-03-23 04:18 by AlfredZhao, 803 阅读, 收藏, 编辑
摘要:故障描述: 与客户沟通,初步确认故障范围大概是在上午的8:30 10:30之间,反应故障现象是Tomcat的连接数满导致应用无法连接,数据库alert中无明显报错,需要协助排查原因。 "1.导入包含故障时刻的数据" "2.创建m_ash表,明确故障时刻" "3.确定异常时刻的top n event" 阅读全文

RAC节点两边存储名字不一致导致的故障及相关延伸

2018-03-01 15:54 by AlfredZhao, 357 阅读, 收藏, 编辑
摘要:起因: 一个客户的实际故障,该故障非常典型,其他客户类似的环境也非常多,所以很值得梳理并记录下来。 环境: Oracle 11.2.0.4 RAC(2 nodes)+ RHEL 6.6 共享存储: EMC powerpath 做的多路径绑定 分别登陆到两个节点,查看设备名称: 我们知道,这些都是po 阅读全文

RAC某节点v$asm_disk查询hang分析处理

2018-01-30 06:25 by AlfredZhao, 966 阅读, 收藏, 编辑
摘要:主题: RAC某节点v$asm_disk查询hang分析处理 环境: Oracle 11.2.0.3 RAC 故障描述: RAC环境2个节点,节点1查询v$asm_disk正常返回结果,节点2查询v$asm_disk就会一直hang,查询会话对应event是ASM file metadata ope 阅读全文

统计信息自动收集任务失效原因排查

2018-01-29 20:26 by AlfredZhao, 372 阅读, 收藏, 编辑
摘要:环境: Oracle 11.2.0.3 RAC 问题: 统计信息自动收集任务失效原因排查 "1.查看自动任务的状态" "2.进一步查看其它信息" "3.解决问题" 1.查看自动任务的状态 查看自动任务的状态,确认是enabled状态: 一般来说,这样的结果,就意味着统计信息自动收集是打开的,如今却是 阅读全文