服务级别设计中关于服务级别协议、运营级别协议和支持合同的理解
12.1.4服务级别设计
在服务规划设计阶段,客户结合服务目录的定义和自身需求,提出服务级别需求。服务供方根据服务级别需求,同时兼顾成本控制和定价,进行服务级别设计,最终形成服务级别协议、运营级别协议和支持合同。
1)服务级别设计
服务级别(Service Level)是指服务供方与客户就服务的质量、性能等方面所达成的双方共同认可的级别要求。服务级别设计是服务供方与需方一起协商适度的目标,经商定后进行文档记录,以便在服务运营期进行监测,把服务交付实际情况和商定的服务级别进行比较,衡量服务质量与价格。服务级别设计的结果在确认后通常会形成服务级别协议。
2)服务级别协议
服务级别协议(SLA)是在一定成本控制下,为保障服务的性能和可靠性,服务供方与客户间定义的一种双方认可的协定。一个完整的SLA也是一个合法的文档,包括涉及的当事人、协定条款(包含应用程序和支持的服务)、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等。同样,服务供方可以对客户在工作负荷和资源使用方面进行规定。
3)运营级别协议
运营级别协议(Operational Level Agreement,OLA)是与某个内部信息服务部门就某项信息系统服务所签订的后台协议,OLA在内部定义了所有参与方的责任,并将这些参与方联合在一起提供某项特别服务。各方就所提供服务的质量和数量等级达成一致。例如,如果SLA中包含了一个针对恢复某个具有高优先级事件的总目标,则OLA中就应该包括针对整个支持链的每个环节的具体目标(如针对服务台响应呼叫的目标、进行事件升级的目标、技术支持人员启动调查和解决相关事件的目标等)。
4)支持合同
支持合同(Underpinning Contract,UC)是指服务供需双方签订的有关服务实施的正式合同。UC是正规的、具备法律效力的协议。从内容上看,UC主要由SLA的内容加上法律条文中的责任、权利和义务构成。
思考
在分析教材内容时,我首先通读了整个章节,确保理解服务级别设计的整体框架和各个组件的逻辑关系。教材将服务级别设计定位在服务规划设计阶段,强调它是一个动态过程:客户基于服务目录提出需求(如服务性能、可靠性),服务供方则需平衡需求与成本控制,通过协商形成可衡量的服务目标。最终输出包括服务级别协议(SLA)、运营级别协议(OLA)和支持合同(UC),三者相互支撑,确保服务在运营期可监测和比较。
具体要点和术语剖析如下:
-
服务级别设计:这是核心过程,涉及供需双方协商“适度目标”(如响应时间、可用性)。关键在“文档记录”,以便后续监测和比较实际服务质量。术语“服务级别”指双方认可的质量标准(如99.9%可用性),设计结果形成SLA。依据教材,设计需考虑成本控制(避免过度承诺),并基于服务目录(预定义服务选项)来引导需求。
-
服务级别协议(SLA):这是设计的主要输出,是一个“合法的文档”。要点包括:它定义了服务性能(如响应速度)、可靠性(如故障率),并包含违约处罚、费用、仲裁等条款。教材强调SLA是“双方认可的协定”,服务供方可规定客户责任(如资源使用限制),确保权责对等。术语“SLA”是服务管理的基石,需与成本控制挂钩。
-
运营级别协议(OLA):这是内部支撑协议,针对服务链的“后台”环节。教材指出OLA将责任分解到内部部门(如服务台、技术支持),确保SLA目标可落地。例如,SLA规定“高优先级事件恢复总目标”,OLA则细化每个环节的具体目标(如响应时间、升级流程)。术语“OLA”强调“联合参与方”,体现内部协作。
-
支持合同(UC):这是正式法律合同,基于SLA内容,但添加法律条文(如责任、义务)。教材描述UC为“正规协议”,它强化了SLA的法律效力,确保服务实施有约束力。UC与SLA的区别在于:SLA是业务协定,UC是法律保障。
整体理解依据教材逻辑:服务级别设计是起点(协商目标),SLA是核心输出(外部承诺),OLA是内部实现(分解责任),UC是法律兜底(正式合同)。四者形成闭环:设计→协议→运营→保障,确保服务可交付、可衡量。关键关系是OLA和UC支持SLA的执行,而SLA源于服务级别设计。
解释
好了,咱们用大白话来聊聊这个教材内容!想象一下,你去餐厅吃饭,服务级别设计就是你和厨师商量这顿饭要怎么吃的过程。你(客户)说:“我要牛排5分熟,10分钟上菜!”厨师(服务供方)想了想成本和厨房能力,说:“行,但8分钟上菜,如果超时,送你甜点!”这商量好的目标,就是服务级别设计——它把你们的“口头约定”变成书面记录,方便后面检查厨师是不是真做到了。
-
SLA(服务级别协议):这就是那纸“保证书”。比如餐厅承诺:“牛排10分钟内上桌,如果超时,免单!”它白纸黑字写了谁(你和餐厅)、什么服务(上菜速度)、违约怎么罚(免单)、费用多少(菜价),甚至包括你吃饭不能乱扔骨头(客户责任)。简单说,SLA是“服务质量的保险合同”,公司用它向客户保证服务又快又稳。
-
OLA(运营级别协议):这是厨房内部的“秘密协议”。比如SLA说“10分钟上菜”,OLA就规定:切菜工3分钟切好肉、厨师5分钟煎好、服务员2分钟端上桌。每个环节都有责任,就像接力赛,谁掉棒谁挨罚。OLA是“团队协作手册”,确保内部不扯皮。
-
UC(支持合同):这是和供应商签的“正式合同”。比如餐厅和牛肉供应商约定:“必须每天送新鲜肉,否则赔钱!”它把SLA的内容(如食材新鲜)加上法律条款,变成有法律效力的“护身符”。
总结一下:服务级别设计是“商量目标”,SLA是“对外保证书”,OLA是“内部操作指南”,UC是“法律保镖”。整个流程就像建房子——设计蓝图(服务级别设计)、和业主签合同(SLA)、工人分工(OLA)、和建材商签协议(UC),确保房子盖得又稳又好!
思考2
现在,结合数据中心运维场景来分析如何举例。数据中心运维涉及管理服务器、网络、存储等IT基础设施,核心是保障服务高可用性(如99.9%正常运行时间)和快速故障响应。教材内容在这里的应用很直接:服务级别设计定义了运维目标(如故障恢复时间),SLA面向客户承诺这些目标,OLA分解到内部团队(如服务台、网络组),UC则处理外部依赖(如硬件供应商)。
分析关键点:
- 场景选择:聚焦常见运维场景,如“服务器宕机恢复”。因为数据中心每天处理类似事件,能清晰展示SLA(客户承诺)、OLA(内部协作)、UC(供应商支持)。
- 教材映射:
- 服务级别设计:数据中心与客户协商需求(如“故障恢复不超过1小时”),考虑成本(如人员配置)。
- SLA:定义可用性指标(如99.95% uptime),违约处罚(如服务抵扣)。
- OLA:内部团队设定响应时间(如服务台5分钟响应)。
- UC:与供应商合同(如服务器保修)。
- 真实性与生动性:例子需基于实际工作,如一个托管服务场景,客户是电商公司,数据中心提供服务器运维。强调OLA的“链条协作”(服务台→技术组→网络组)和UC的“法律兜底”,避免理论化。
这样举例能帮助学习者看到:教材内容不是空谈,而是运维日常的“操作手册”。
例子
场景:数据中心为某电商公司提供服务器托管服务,确保网站24/7可用。
-
服务级别设计:电商客户要求“网站全年99.9%可用性,故障恢复不超过30分钟”。数据中心评估成本(如增加备份服务器)后,设计目标为“99.95%可用性,恢复时间≤25分钟”,并记录在文档中。
-
SLA(服务级别协议):双方签署SLA,规定:
- 服务性能:每月宕机时间≤21分钟(99.95%可用性)。
- 违约处罚:超时每分钟赔偿客户100元。
- 客户责任:电商需及时报告故障,否则免责。
- (实际监测:数据中心用监控工具实时比较实际宕机时间与SLA目标。)
-
OLA(运营级别协议):数据中心内部签订OLA,分解SLA目标:
- 服务台:事件报告后5分钟内响应并分类。
- 技术支持:10分钟内诊断原因(如硬件故障)。
- 网络团队:10分钟内恢复服务(如切换备用服务器)。
- (例如,一次服务器宕机:服务台2分钟响应,技术组8分钟定位故障,网络组15分钟恢复——总时间25分钟,符合OLA和SLA。)
-
UC(支持合同):数据中心与硬件供应商(如戴尔)签订UC,基于SLA内容:
- 条款:供应商提供24小时备件支持,故障响应≤1小时。
- 法律义务:超时导致数据中心违约时,供应商赔偿损失。
- (实际应用:服务器硬盘故障时,供应商30分钟送达备件,支持OLA快速恢复。)
应用效果:这个例子展示了教材内容在实际运维中的闭环。服务级别设计确保目标可行,SLA让客户信任,OLA协调团队高效协作,UC降低外部风险。最终,数据中心不仅满足客户需求,还通过成本控制(如优化备份策略)提升盈利。
浙公网安备 33010602011771号