06 2019 档案

摘要:关于故障的事后复盘,英文名 Case Study是非常有必要做的,当然是根据故障的级别,不可能做到每个故障都Case Study,除非人员和时间充足; 文档能力也是能力的一种,一般工程师的文档能力比较薄弱或者一般 ,但是一般各种类型的文档其实都有模板,根据模板填充内容也能事半功倍。 故障要有记录, 阅读全文
posted @ 2019-06-30 23:41 Topic 阅读(2500) 评论(0) 推荐(0)
摘要:当我们通过Jenkins构建job的时候,是可以获取到git Change Log 的信息, 即本次上线修改了什么功能,我们将这个信息发送到微信群相关人员可直接获取到上线变更信息, 这样就不需要人为的去通告,以下是效果图: 主要用到的这个插件: https://github.com/daniel-b 阅读全文
posted @ 2019-06-30 22:43 Topic 阅读(1800) 评论(1) 推荐(0)
摘要:背景: 如果我们运维的是web网站, 那么http的状态码是必须要监控的,当出现4xx 5xxx的状态码的时候需要能发出报警,然后定位问题。当我们监控nginx的状态码出现错误状态码的时候, 一般的处理方法是通过kibana查询是哪个接口导致从而确定是哪个服务,再进一步登录业务机器查询业务日志确定原 阅读全文
posted @ 2019-06-17 15:42 Topic 阅读(957) 评论(0) 推荐(0)

转载请注明出处. 作者: 运维的自我修养 地址: http://www.cnblogs.com/topicjie/