阿里云 ECS 系统崩溃恢复数据过程


故障介绍

系统:ubuntu

研发人员告知 ECS 无法 SSH 连接。登录到阿里云后台,通过 vnc 连接查看,无论输入任何命令都是:

# ls
Segmentation fault
# cd 
Segmentation fault
# reboot
Segmentation fault

随即,尝试软重启 ECS ,重启后无法进入系统。这里也有考虑到重启后无法进入系统的情况,但是在无法进行任何命令操作的时候只能重启操作,如下:

image


尝试过 单用户模式救援模式 都无法进入系统,报错情况一致,于是只能找阿里云技术寻求支持(这里吐槽下,阿里云工单是真的有点慢)。得到以下诊断结果:

image-20210701104143578


然而,最终还是没能救回来。ECS云盘也没有做过快照,更别提数据备份。虽然是测试机,但是研发跑了很多应用和数据。恢复还是很有必要的,阿里云给出了其他方案,还是很不错的。如下:

image-20210701104335756


于是,准备按照阿里云提供的恢复方案执行一下。

初始化操作:

  1. 您先对此服务器的系统盘和数据盘创建快照进行备份。创建快照,请您参看文档:https://help.aliyun.com/document_detail/25455.html
  2. 重新初始化系统盘,恢复到最初始的状态,然后正常启动服务器。重新初始化系统盘,请您参看文档:https://help.aliyun.com/document_detail/25449.html
  3. 如果是linux系统,重新初始化系统盘后,/etc/fstab文件中的挂载信息会被重置,您需要重新创建挂载点并挂载文件系统。
  4. 您通过系统盘快照创建一个按量付费的云盘,然后把该云盘挂载到服务器中作为数据盘,从数据盘中找回您所需数据。使用快照创建云盘,请您参看文档:https://help.aliyun.com/document_detail/32317.html
  5. 挂载云盘到服务器上。请您参考文档 https://help.aliyun.com/document_detail/25446.html 进行。 说明:云盘只能挂载到同一地域下同一可用区内的实例上,不能跨可用区挂载。


恢复过程


创建云盘快照

https://help.aliyun.com/document_detail/25455.html


云盘 创建 快照

image-20210701104900240



初始化系统盘

https://help.aliyun.com/document_detail/25449.html


在初始化系统盘的时候,首先需要关闭 ECS ,然后在点击 重新初始化云盘

切记:在进行初始化云盘的时候,请确保云盘快照已经完成!

image-20210701110759009


重新初始化后,就可以直接 SSH 连接到 ECS 了。

image-20210701111049863



快照创建云盘

https://help.aliyun.com/document_detail/32317.html

该步骤会产生费用。


通过 快照 创建云盘

image-20210701113745351

image-20210701112546731


创建成功后,直接切换到 ECS 查看磁盘。

image-20210701113848378


直接就进行挂载,然后备份数据。

总结


马老师说过:我不断的提醒自己,要在阳光灿烂的日子修屋顶,不要等到下大雨去修。 共勉。


--- EOF ---
posted @ 2021-07-01 15:46  hukey  阅读(886)  评论(0编辑  收藏  举报