服务级别协议(SLA)与运行水平协议(OLA):
a.定义
服务级别协议,是 IT 服务提供方和客户之间就服务提供中关键的服务目标及双方的责任等有关细节问题而签订的协议。既然名为协议,通常就是用法律术语完成,其内容包含所提供服务的范围和质量。
b.构成
一份典型的 SLA 通常应定义以下 4 方面活动。
(1).衡量各项动态指标满足 SLA 的定义;
(2).检査各项被衡量的指标,并进行问题诊断和根源分析;
(3).采取适当的行动解决问题;
(4).为满足 SLA 而持续维护及改进服务行为。
除了服务活动的定义外,定义淸晰、简明、一致性的数据点也是签定 SLA 双方避免风险,确保协议执行的必要条件。对于每一条服务级别的定义通常都包括以下数据点。
(1).分类定义:在 ITIL 中成为服务目录。指一个需要被衡量、报告和持续提供的关键业务流程或功能。
(2).服务时间:需要遵循 SLA 的时间。应清楚地描述 SLA 执行的日期和时间及特殊的时间约定。
(3).服务责任:对服务需求详细说明的条款。
(4).服务级别指标:对服务供应方工作作的考核方法,通常以百分比表达。
(5).计量公式:描述衡呈服务的数学公式。
(6).测量间隔 / 报告周期:判断 SLA 足否被满足的测量周期。
(7).数据源:描述数据的类型及来源,如何保存,何人负责。
(8).沟通:规定在服务供应方打破 SLA 时,应在多长时间内通知何人。这包括在打破 SLA 时的升级行为和管理 。
除了上述技术性的描述外,作为条款性文件,SLA 还应包含例外情况、奖惩措施及计算方法。下而我们以一个 SLA 样例说明 SLA 的构成。
c.案例
我们以 A 作为服务接受方,B 作为服务提供方。A 公司的关键业务为 XYZ 。在该例中我们仅定义一项服务级别。我们将简化法律条款性的部分,仅以数据点的描述为主。
服务级别协议
甲方:A
乙方:B
本协议覆盖 XYZ 服务的供成与支持,(简述服务内容)。
本协议有效期为 12 个月,从_年_月_日到_年_月_日。本协议将被每年审核,变更部分必须记录于附件中的表格由双方签宁确认。
服务级别定义:XYZ 应用的端到端响应时间
有效时间:每天 24 小时,从周日到周六,不包拈用户定义的国定假期。
服务级别指标:响应错误小于总连接数的 1%。
响应时间:小于等于 5 秒。
沟通:
(1).服务分联系方式:support.xxxx.com 或 800-XXX
(2).响应时间:乙方承诺在接到报告后 5 分钟内回拨ill话给客户(3).升级行为: 30分钟内违背 SLA,通知至乙方项目经埋;4 小时内 SLA 失败并未能找到恢复方法,通知至甲乙双方区域经理。(4).升级 管理: 向甲乙双方项 B 经理提供 SLA 失败的月报。向甲乙双方区域经埋提供 SLA 失畋的季报。
双方责任约定:与 XYZ 应用相关的服务器由甲方拥有,并位于甲方数据中心,甲方应向乙方提供必要的访问系统的权限。乙方保证遵守甲方的安全规则。
计算公式:响应时间 <= 5 秒。所谓响应时间指从发出初始査询到用户屏幕上显示出所有字符。
测量间隔和报告周期:测量轮询间隔为 1 分钟。报告周期为周报(累积数据)。
数据源:测量指标将由 XX 自动化工具完成。内容包括测量点响应时间值及包含日期和时间的时间戳信息。
例外情况及奖惩措施:(略)2.OLA
a.定义操作级别协议,是 IT 服务提供方和组织内部 IT 部门就某个具体服务项目的提供而达成的协议。属于完成服务级别协议所需的支撑性协议。
b.构成OLA 的结构与 SLA 类似,也包括活动和数据点。与 SLA 相同的是同样需要描述范围、时间、目标。但在数据点的表述方面则要丰富的多,一方面由于操作级别协议更加面向技术,更为突出的是操作级别协议中详细描述了提供服务的 IT 部门在整个运维管理 活动中的角色和职责。如果服务供应方己按照 ITIL 最佳实践来组织自己的 IT 运维活动的话,那么 OLA 中将涉及 Service Operation 和 Service Transition 中的大部分流程。下面我们以 SLA 样例中的同样场景来举一个 OLA 的例子。
c.案例服务供应方 B 的下属部门 C 负责数据库维护。
操作级别协议甲方:B乙方:C
本协议覆盖支撑 XYZ 服务的数据库服务的供应与支持,(简述服务目标)。本协议有效期为 12 个月,从_年_月_日到_年_月_日。本协议将被每年审核,变更部分必须记录于附件中的表格由双方签字确认。
服务描述:对 XYZ 应用中典型交易场景的数据库响应时间有效时间:每天 24 小时,每周 7 天
服务目标:C 方提供 B 方数据库维护服务,每周五下午 4 点由 C 提供给 B 部门经埋本周的服务报访以供审核。
沟通:
(1).C 方联系方式:分机号 XXX,值班手机号 13XXXXXX(2).在服务台及事件管理流程中的响应时间和职责:C 方值班人员在接到 B 方故障申告后10分钟内,将事件转发到相应的技水工程师负责处理,并回应 B 方。(3).在问题管理流程中的响应时间和职责:(略)(4).在变更管理 的职责:(略)(5).在发布 管理 流程中的 职责 :(略)(6).在配制 管理 流程中的 职责 :(略)(7).在信息安全 管理 中的 职责 :(略)(8).在可用性 管理 中的职责:(略)(9).在服务可持续性管埋中的职责:(略)
(10).在容量管理中的职责:(略)
(11).在服务级别管理中的职责:在 SLA 中辅助定义合适的目标,关心数据库领域的 SLA 组件。
3. SLA 和 OLA 的区别
总结以下三点区别:
a.定义方面SLA 面向外部客户,OLA 面向 IT 服务供应者内部。b.服务目标方面SLA 的主体是业务主体,它可能是业务应用,关键流程及应用场景,也可以是公司层面,部门层面的和个人层面的;OLA 的主体是资源主体,它可以网络、数据库、打印机、某个进程或特定链路。c.内容方面SLA 强调可用性、可靠性及质量指标,以指标性内容为主;OLA 在强调指标性内容的同时还强调保障这种指标的活动,只有在规范化的流程活动下,才可以更有力地实现服务改进计划。