云计算之路-阿里云上:13:43-13:44之间RDS故障影响了全站的正常访问

抱歉!13:43-13:44之间,由于阿里云RDS(云数据库)出现2分钟突发故障,影响了全站的正常访问,给大家带来了麻烦,望大家谅解!

故障期间,应用程序日志中记录的错误信息如下:

System.Data.SqlClient.SqlException: 在向服务器发送请求时发生传输级错误。 (provider: TCP Provider, error: 0 - 远程主机强迫关闭了一个现有的连接。)

System.Data.SqlClient.SqlException: 在从服务器接收结果时发生传输级错误。 (provider: TCP Provider, error: 0 - 指定的网络名不再可用。)

System.Data.SqlClient.SqlException (0x80131904): 在从服务器接收结果时发生传输级错误。 (provider: TCP Provider, error: 0 - 信号灯超时时间已到)

System.Data.SqlClient.SqlException (0x80131904): 已成功与服务器建立连接,但是在登录前的握手期间发生错误。 (provider: SSL Provider, error: 0 - 等待的操作过时。)

System.Data.SqlClient.SqlException: 在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器。请验证实例名称是否正确并且 SQL Server 已配置为允许远程连接。 (provider: SQL Network Interfaces, error: 26 - 定位指定的服务器/实例时出错)

System.Data.SqlClient.SqlException (0x80131904): Timeout 时间已到。在操作完成之前超时时间已过或服务器未响应。  尝试连接到 Principle 服务器时发生了此故障。 ---> System.ComponentModel.Win32Exception (0x80004005): 等待的操作过时。

Web服务器中Windows性能监视器的监控截图:

已经向阿里云提交了工单,问题原因还在排查中。。。

【更新】

15:18,问题排查进展:物理机故障导致实例进行了HA切换。

15:58,阿里云客服确认是物理机硬件故障所致,现已修复。

posted @ 2015-09-25 14:47  博客园团队  阅读(2876)  评论(16编辑  收藏  举报