可靠可用设计模式
2025.4.29
1.可靠性的核心是冗余设计
2.故障处理模式
2.1.故障隔离,可以考虑可靠性沙箱等
2.2.故障恢复
2.3.故障检测
3.过载控制
3.1.过载限流
3.2.弹性伸缩
4.升级不中断业务
5.地理容灾
6.数据要满足数据高可用
7.应对瞬时故障——有限重试——考虑到杀手消息,重试可能导致多个节点出现故障——进一步处理方法是切片隔离
8.业务过载的传统应对方案:过载限流、优先级流控——都会导致业务受损,进一步处理:推迟维护作业、优雅降级等
9.弹性伸缩:补充资源,但是没有很强的实时性,需要一定的时间,所以要和传统限流一起使用
10.数据同步:逻辑复制
11.统一仲裁:冗余节点,过载切换之后,各服务状态割裂,甚至都不能正常提供服务了

浙公网安备 33010602011771号