SLI、SLO、SLA
SLI(Service Level Indicator)服务等级指标:SLI指定了SLA中所提供服务某一维度的可量化指标,且必须具有清晰严谨的定义和计算方式。比如,对于某一网站的单实例服务器,一个简单的SLI定义是由客户端所发出合法的请求得到正常响应的百分比,合法的定义是请求参数和资源类型能够被服务端约定的协议解析成功,正常响应的定义是请求结果中不包含超出协议约定的错误或非预期数据。
SLO(Service Level Object)服务等级目标:SLO明确了SLA中所提供服务某一维度的期望状态,是围绕SLI构建的目标。SLO是客户感知和判断服务质量最为直观的方式,常见的说法如“XX 可用性达到几个 9”就是一种 SLO。规范来说,SLO有指标范围和实现时间要求,这意味着在特定时间窗口内(通常是服务周期),涉及的 SLI 必须达到预定的指标标准,并且在该时间段内的实现比例应达到预期。如果未能达到SLO,则应触发SLA中定义的后果,一般为对SLA中服务提供方的惩罚以及对客户的补偿方案。
可以简单理解为:SLA = SLO + 后果 = SLI + 实现指标和时间占比要求 + 后果。可以看出,服务SLA是众多云厂商获取客户青睐和信任的有效竞争手段和必要承诺。通过明确服务质量的量化指标、期望目标以及未达成目标时的补偿措施,SLA 有助于建立客户与服务提供商之间的信任关系,并在竞争激烈的市场中提升服务商的竞争力。
SLA常见指标
服务可用性、数据可靠性、请求错误率、吞吐量、延迟等
-
错误预算量化了在特定时间范围内可接受的服务失效或不符合服务水平目标(SLO)的程度,其计算方式依赖于SLO
-
计算方式:服务周期窗口总值 *(1 - SLO)
参考
https://mp.weixin.qq.com/s/kV7q92jX0MXfqmQ0Wcv09Q