LUN映射出错导致文件系统一致性出错的服务器数据恢复案例
服务器数据恢复环境:
某公司的光纤SAN存储系统,6块硬盘组建一组RAID6,划分若干LUN,MAP到不同的SOLARIS操作系统服务器上。
服务器故障&分析:
由于业务增长需要新增应用,工作人员增加了一台IBM服务器,在SAN还在线的状态下将存储中的某个LUN映射到新增加的那台IBM服务器上。工作人员在进行操作之前不知道这个映射的卷之前已经MAP到SOLARIS操作系统上的某个LUN上了。当工作人员发现到这个问题后,LUN已经进行了部分的初始化,SOLARIS操作系统中的磁盘报错,重启存储后发现卷无法挂载。
阅读全文
posted @ 2023-07-31 16:11
数据库恢复环境:
Sybase版本:SQL Anywhere 8.0。
数据库故障:
数据库所在的设备意外断电后,数据库无法启动。
作为存储和处理数据的系统,oracle数据库在使用过程中不可避免会出现各种导致数据丢失和数据损坏的故障。北亚企安数据恢复工程师根据十多年的案例经验,总结出oracle数据库常见故障以及恢复可能性。
服务器数据恢复环境:
IBM某型号存储;
Solaris操作系统,部署Oracle数据库。
服务器故障:
重建MDisk导致对应的存储池中的VDisk丢失,导致Solaris操作系统中的Oracle数据库无法使用。
服务器数据恢复环境:
一台服务器挂载三台IBM某型号存储设备,共64块SAS硬盘,组建RAID5磁盘阵列;
服务器操作系统:Windows Server;文件系统:NTFS。
服务器故障:
一台存储中的一块硬盘离线,热备盘启用开始同步数据。在同步过程中,和离线磁盘同一组Mdisk中的另一块磁盘离线,热备盘同步失败,该组Mdisk失效,导致通用卷不可用。
服务器数据恢复环境:
一台Linux Redhat操作系统服务器上有一组由5块硬盘组建的raid5阵列,包含一块热备盘。上层部署一个OA系统和Oracle数据库。
服务器故障:
raid5阵列中的1块磁盘离线,硬盘离线却没有激活热备盘,直到另外一块磁盘离线导致阵列崩溃。
服务器数据恢复环境:
一台挂载在Windows server操作系统服务器上的v7000存储,划分了一个分区,格式化为NTFS文件系统,该分区存放oracle数据库。
服务器故障:
服务器在工作过程中由于未知原因宕机,工作人员重启服务器。在服务器操作系统进行磁盘扫描修复时,工作人员强制关机并断开了存储和服务器之间的连接,这个操作导致存储文件系统损坏,报错:“文件或目录损坏且无法读取”。
服务器数据恢复环境:
某公司信息管理平台,数台VMware ESX SERVER虚拟机共享一台IBM某型号存储。
服务器故障:
VC报告虚拟磁盘丢失,管理员ssh到ESX中执行fdisk -l命令查看磁盘,发现STORAGE已经没有分区表了。重启设备后,ESX SERVER无法连接到STORAGE。
服务器数据恢复环境:
一台服务器上有两组分别由4块SAS硬盘组建的raid5磁盘阵列,这两组raid5阵列划分LUN并组成LVM结构,格式化为EXT3文件系统。
服务器故障:
一组raid5阵列上的一块硬盘未知原因离线,热备盘上线替换离线硬盘并开始同步数据。在热备盘上线同步数据过程中,该阵列中又有一块磁盘离线,热备盘同步失败,该组raid5阵列崩溃,LVM结构不完整,EXT3文件系统不可用。
北亚企安数据恢复工程师对两块离线磁盘进行初检,发现先离线的那块硬盘无法识别,初步推断该硬盘存在硬件故障,需要开盘修复,另一块离线硬盘可以正常识别。
打开oracle数据库报错:“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。
北亚企安数据恢复工程师检测数据库文件发现sysaux01.dbf有坏块,sysaux01.dbf文件损坏。数据库无备份,不能通过备份去恢复数据库。用户提供了该Oracle数据库Oracle_Home目录下的所有文件,要求恢复zxfg用户下的数据。
服务器数据恢复环境:
一台linux操作系统网站服务器,该服务器上部署了几十个网站,服务器上只有一块SATA硬盘。
服务器故障&分析:
服务器正常运行中突然宕机,管理员尝试多次重新启动服务器失败,将服务器上的硬盘拆下进行检测,发现该硬盘存在上百个坏扇区。
服务器数据恢复环境:
一台infortrend存储,有一组由12块硬盘组建的RAID6,RAID6的所有空间划分给一个LUN并映射到WINDOWS系统上,WINDOWS系统上划分了一个GPT分区。
服务器故障&分析:
存储无法访问,经过检查发现存储中有3块硬盘离线。工作人员通过一系列操作让存储掉线磁盘上线并开始rebuild,但是这个时候发现分区打不开,所有数据无法访问。为避免情况进一步恶化,工作人员中止了rebuild并关机。
经过当地的数据恢复机构进行恢复后,还是有大量数据丢失和无法打开。
服务器数据恢复环境:
一台HP ProLiant DL系列某型号服务器,hp smart array控制器,挂载了一台国产磁盘阵列,磁盘阵列中是一组由十几块SCSI硬盘组建的RAID5,RAID中的冗余采用双循环的校验方式。
服务器操作系统为LINUX,上层搭建了NFS+FTP,服务器作为公司内部文件服务器使用。
服务器故障&检测:
机房搬迁后在新机房连接好各种线路,服务器开机后无法识别RAID,提示未做初始化。
某法院的一台LeftHand存储因raid磁盘故障导致存储不可用,更换磁盘强制上线后存储仍然不可用。
曙光某型号光纤存储柜,16块光纤磁盘组建了2组RAID5磁盘阵列,每组raid5阵列中有7块成员盘,另外2块磁盘配置为全局热备盘使用。
第一组RAID5阵列划分了3个LUN:1个LUN分配给linux主机、第2个LUN分配给sun小型机,第3个LUN分配给esxi主机。
第二组RAID5阵列全部分配给一台ESXI主机,运行10台虚拟机。
服务器数据恢复环境:
两台SPARC SOLARIS操作系统服务器通过光纤交换机共享一台存储作为集群使用。平时是一台服务器(以下称为主服务器)在运行,如果该服务器发生故障宕机,只需要将这台服务器关机后开启另外一台服务器(以下称备用服务器)进行接管即可。由于配置不当,两台服务器不能很好地对存储互斥。
服务器故障&分析:
管理员在对服务器进行巡检时开启备用的那台服务器,该服务器连接了一组未知的大容量磁盘。由于该服务器在主服务器正常工作的情况下不会启用,处于闲置的状态,所以管理员误以为该服务器连接的这块大容量磁盘也处于闲置状态,于是将该大容量磁盘的某个分区做了newfs。然而这个大容量磁盘就是那台共享存储,主服务器报警宕机。
服务器数据恢复环境:
一台IBM某型号服务器,4块SAS磁盘组建了一组RAID5磁盘阵列。服务器安装的windows server操作系统,上面运行了一个Oracle单节点,数据存储为文件系统,无归档。该oracle数据库的数据量不大,只有一个用户,使用默认的users表空间,users空间下只有一个不大的数据文件。
服务器故障:
由于服务器超负荷运行,RAID5磁盘阵列出现问题。为了保证服务器能正常稳定运行,工作人员做了重建RAID的操作,在重建RAID过程中由于RAID中的一块磁盘出现故障,RAID初始化中止,少量数据被同步而破坏,但是RAID5磁盘阵列已经可以访问。
服务器操作系统虽然出现错误,但还能正常启动。oracle数据库所在D盘分区报错无法打开,工作人员做了chkdsk后能正常打开D盘分区,但oracle数据库无法启动。工作人员在D盘上重装了oracle数据库并导入了以前备份的dmp文件,但数据和出故障前的oracle数据库数据相差太多。
服务器数据恢复环境:
DELL PowerVault系列某型号存储,15块硬盘搭建了一组RAID5磁盘阵列。
服务器故障&检测:
存储设备raid5阵列中一块磁盘由于未知原因离线,管理员对该磁盘阵列进行了同步操作。在同步的过程中又有一块磁盘指示灯报警,磁盘离线,磁盘阵列同步失败,raid5阵列崩溃,存储无法正常工作。
服务器数据恢复环境:
IBM某型号服务器,服务器中5块SAS磁盘组建了一组RAID5磁盘阵列。划分了一个LUN以及3个分区:第一个分区存放windows server系统,第二个分区存放SQL Server数据库,第三个分区存放备份文件。
服务器故障:
服务器在运行过程中崩溃,raid阵列不可用。北亚企安数据恢复工程师对故障服务器中的raid5磁盘阵列进行初检,发现故障服务器raid5中的2块磁盘离线,经过检测均存在物理故障。
一台IBM V7000存储中的vdisk丢失,Solaris操作系统中的部署的Oracle数据库不可用。经过和工作人员的沟通得知故障原因:工作人员进行重建MDisk的操作,将原先的raid10重建为raid6,然后又再次重建为raid10,这一系列操作导致存储池中的VDisk丢失,导致上层Solaris操作系统中的Oracle数据库不可用。
服务器数据恢复环境:
一台ibm某型号服务器,5块硬盘组建一组raid5磁盘阵列,redhat linux操作系统,上层部署有oracle数据库。
服务器故障:
raid5阵列中两块硬盘离线,服务器崩溃。经过初检发现故障服务器中的硬盘不存在物理故障,热备盘未激活,无同步迹象。
浙公网安备 33010602011771号