2019年3月13日

上线事故处理流程

摘要:目的 整理一套上线事故的应急方案,快速止损。本文档不讨论架构的合理性、以及备用方案相关的事情。 针对核心服务,一旦有线上事故,负责人员高优处理 流程 1. 快速定位问题,看服务监控、看服务日志、咨询运维人员等等,如果能5分钟内定位原因,走修复流程,否则, 2. 快速回滚代码,这里容易有个经验主义作祟 阅读全文

posted @ 2019-03-13 09:57 Ryanyanglibin 阅读(183) 评论(0) 推荐(0) 编辑

系统初始化手册

摘要:系统初始化手册 一、概述 1、目的 为了加快和提高服务器资源交付应用和投入生产的效率,服务器的部署工作要做到规范化,标准化;在规范化,标准化的前提下,进一步实现自动化/半自动化;从而最终提高工作效率,降低遗漏等错误发生率。鉴于以上缘由,催化了此文档的产生,一方面也是为了方便部署时的参考,防止在部署过 阅读全文

posted @ 2019-03-13 09:53 Ryanyanglibin 阅读(383) 评论(0) 推荐(0) 编辑

使用kingshard遇到的坑

摘要:1. 禁止用mysqldump 连接kingshard, 会导致表锁死 2. 读取NULL值变为文本 1. 通过kingshard连接 select出来的null值变为文本"NULL" 3. kingshard 无法join分片表 1. 假设a与b都是分片表, 即使a与b分片一致也无法join 2. 阅读全文

posted @ 2019-03-13 09:32 Ryanyanglibin 阅读(559) 评论(0) 推荐(0) 编辑

导航