降级可用

当条件有限而不能向用户提供完整服务时,可以以降级的方式提供有损的服务。

降级可用的目标是:最大程度的保证关键服务的可用性。

为什么要有降级可用

  • 系统不是绝对可靠的: 机器故障、网络波动在系统运行中是经常会遇到的。
  • 系统的成本是有限制的: 为了系统能更加稳定地运行,系统设计时可能会进行容灾(资源冗余,包括机器、网络、人员等)。但是这种冗余不是无限度的,成本是有限的。有些时候,系统可能会有一些超过容灾系统的负载能力的突然高流量。

降级可用的实现步骤

要实现降级可用的系统,在产品设计和技术实现两个阶段都应该有降级的意识。

实现降级可用的系统,通常包含以下步骤:

  1. 服务分级: 在产品设计阶段,需要对服务的应用场景进行还原。要清楚地认识到哪些服务是系统的核心服务,哪些服务是支撑服务。
  2. 自身能力评估: 在产品设计阶段,要了解自己拥有的资源,对自己的负载能力有较好的评估。简单的说,就是要清楚在各种条件下,自己能提供什么样的服务。
  3. 系统划分(分级): 在技术实现初期(系统设计),需要遵循大系统小做的原则,对系统进行拆分,避免各个服务互相影响,降低子模块耦合性。
  4. 自我监控: 系统要有自我监控能力,了解当前负载,评估是否需要提供降级服务。
  5. 降级服务: 满足降级条件时,分级提供降级服务。
  6. 系统恢复: 当系统重新满足可以提供完整服务的条件时,升级服务等级(有能力时,还应该对之前放弃的局部服务进行恢复)
posted @ 2025-07-17 11:42  使用D  阅读(15)  评论(0)    收藏  举报