【稳定性】【健壮性】【监控】紧急预案，限流，降级，熔断

稳定性：

　　以下属于稳定性考虑的事情：

　　为什么需要各个维度的指标呢？

　　因为其实问题出现的话，肯定是有连锁反应的，我们也有根据发现的表象立即分析出问题的根因，并且需要评估其影响，做最合理的应对方案。

　　掌控：必须要有对代码的掌控、对技术栈的深入了解，特别对于复杂的业务，在垃圾堆里面找bug或许需要很长时间。好的代码可以快速让你定位问题和想出解决方案

　　例子：数据库索引自动选择，导致数据库索引走错，业务抖动

　　护航工具：有一定的护航工具，对业务核心流程和状态有必要的控制权，是系统具有容错性的重要保障。

　　演练：压测。

　　限流降级：减少流量进入，是快速恢复的方案之一

　　监控：最重要的一part；

业务单量

机器指标：

业务监控：

死信队列

QPS\TPS

Sentinel：限流中间件

磁盘满：定位大文件：du -sh /home/admin/* |grep G

posted @ 2022-05-20 01:08 饭小胖阅读(111) 评论(0) 收藏举报

刷新页面返回顶部