02 2022 档案

摘要:事故过程 某天下午,客户突然反映生产环境系统无法使用,页面、小程序等接口均无响应,发生了宕机,紧急重启之后恢复正常。 原因排查 华为云系统监控显示,宕机之前数据库连接数飙升,redis连接数飙升。查看该时间段日志,发现大量sql连接超时无法执行。逐步缩短时间间隔寻找慢sql的起始发生时间点,最后发现 阅读全文
posted @ 2022-02-08 15:42 imagine0707 阅读(450) 评论(0) 推荐(0)