阿里云ECS无法开机解决方法及安全操作流程

之前有一次阿里云ECS磁盘满了,连不上主机,后来点了重启就无法开机了,发工单给阿里云的工程师得到回复是这样的:


您的服务器系统在启动过程中会卡住,不能正常启动完成。 在系统启动时,设置用单用户模式可以正常进入系统,单用户模式进去,检查系统里边也没有发现异常,尝试把 /etc/rc3.d/ 下边开机启动的服务都取消了,重启服务器还是会卡在,目前没能修复系统启动的问题。
当前是单用户模式进去的,您也可以从控制台登录服务器里,检查一下系统里的启动服务情况。
可以备份一下服务器里的数据,考虑给服务器重新初始化系统,恢复到最初正常的系统启动。

我后来重新创建了一个 ECS,使用和故障机器一样的系统版本,增加一块数据盘,数据盘以此前备份的快照创建。

启动后,fdisk -l 查看分区,使用 mount /dev/vdb1 /mnt 挂载成功。(需要注意,每个系统的分区名称可能不一样,自己实际看一下再挂载)

到这里心里基本有底,备份故障机器,重新装系统,直接用 mount /dev/vdb1 /mnt 挂载成功。

总结恢复流程:

1、备份快照
2、重装系统
3、fdisk -l 查看分区
4、挂载数据盘
mount /dev/vdb1 /mnt 
(需要注意,每个系统的分区名称可能不一样,自己实际看一下再挂载)
5、注意设置开机自动挂载磁盘

也可以新开一个机器 挂载通过快照创建的云盘。

这里要特别说一下,我的数据都在 RDS 上,所以重新获得数据盘的文件即可,系统无所谓。数据和 WEB 服务器分离、系统和网站文件磁盘分离,这是有必要的。

posted @ 2021-03-14 13:37  赤金册  阅读(781)  评论(0编辑  收藏  举报