故障公告:黑色星期四(暂时恢复正常)

非常非常抱歉,今天上午园子又出现大范围故障,由此给您很大的麻烦,请您谅解。

问题非常非常奇怪,是上周四故障(故障公告:高并发下全线崩溃)的重演。

目前来看似乎是 k8s 集群的网络通信出现了问题,k8s 集群是我们用阿里云服务器自己搭建的。

故障还在进一步排查中。。。

抱歉抱歉抱歉。。。

更新:
13:25 完成了重启 k8s 集群所有 worker 节点服务器(共23台)
...... 继续故障
15:00 再次尝试进行数据库服务器(阿里云RDS SQL Server实例)的主备切换后暂时恢复正常。上午故障时进行过多次主备切换,未能恢复,今天下午在几乎绝望时再次尝试主备切换,切换完成后突然恢复正常。

posted @ 2020-12-10 11:29  博客园团队  阅读(5728)  评论(91编辑  收藏  举报