2017-04-30 问题处理时间线

2017年4月30日 20:40

收到反馈,游戏网络功能无法使用

 

处理过程:

1,登陆服务器通过console后台启动账号进程,发现无法启动

2,登陆账号服务器端,切换用户,手动启动账号进程,提示无法连接redis

3,在登陆家园服务器,切换用户,手动启动家园进程,同样提示无法连接redis

##账号服使用一台独立的redis,家园服也使用一台独立的redis,两者不相关

4,登陆redis服务器,发现redis进程不在,遂执行server redis restart ,执行后没有任何提示,检查redis进程不在

5,查看redis日志,没有发现有价值的信息

6,大家决定重启账号redis和家园redis 服务器(灾难的开始),redis数据保存在内存中,重启机器后,内存数据丢失

7,服务器启动后,执行server redis start

8,大于时间到了晚上21点左右,收到反馈,玩家家园等级被降级,玩家身上的货币被清掉

9,自此问题已经很严重,玩家家园的数据被回档了,通知相关同事到岗,将事故发生前最新的数据进行对比,然后对丢失数据的玩家重新写入。解决此类问题,一般需要通宵熬夜

 

 

结论:

1,遇事一定要冷静,不管外界怎么干扰,一定要冷静处理

2,在做这步操作前,一定一定一定要考虑最坏的结果是什么?

3,如果引起最坏的结果,要如何解决?

4,以上方案考虑清楚后,在执行下一步操作。

5,无论什么数据,备份是放在第一位的,首先考虑备份是否完整,有效,是否能及时使用。

posted @ 2017-05-01 11:49  Ray雷  阅读(173)  评论(0编辑  收藏  举报