上线事故处理流程
摘要:
目的 整理一套上线事故的应急方案,快速止损。本文档不讨论架构的合理性、以及备用方案相关的事情。 针对核心服务,一旦有线上事故,负责人员高优处理 流程 1. 快速定位问题,看服务监控、看服务日志、咨询运维人员等等,如果能5分钟内定位原因,走修复流程,否则, 2. 快速回滚代码,这里容易有个经验主义作祟 阅读全文
posted @ 2019-03-13 09:57 Ryanyanglibin 阅读(434) 评论(0) 推荐(0) 编辑