应急管理服务
1)应急预案
IT服务连续性管理(IT servers continuity management,ITSCM)作为BCM的一个子集,关注的是组织在灾难发生时, IT基础设施和IT服务能够在规定的时间内得以恢复。本公司致力于协助企业,在连续性计划中制定适用不同系统以及对应风险的应急预案, 应急预案通常可以分为以下四个层级:
应急预案总则
应急预案总则,用以说明应急预案的框架,作为各类预案开发的原则和参考,指导组织的各负责人开发和维护相关的预案。
应急预案总则首先包括应急预案的规划与分类,并通过业务影响分析和风险分析明确组织的哪些业务或系统,需要基于哪些相应风险制定应急预案;
其次要明确应急的组织架构,确定各组别的职责和人员。建议建立组织级的应急管理组织,明确其制定组织的应急战略、审核批准组织应急策略和预案、决策应急响应与恢复重大事宜等职责。
第三要明确各预案的编写原则与要点。确定预案的编写、更新、修改、审批、启动、终止等要求。
第四确定发生突发应急事件的处理原则。包括事前预警、事中处理、事后分析、事件报告等原则。
第五要明确应急准备原则。包括应急资源的准备、培训与宣导、演练等要求。
应急预案的执行指引
每个预案有单独的执行指引,说明当该类事件发生时的应急组织架构和职责、应急响应流程和恢复步骤,用于应急工作小组负责人指挥整个应急操作。
其中对应应急预案总则,也应有详细的目标范围、组织结构、应急资源、启动应急预案条件、恢复计划、灾后重建与回复等内容。
应急预案的应对方案
应对方案针对不同场景的应对措施和技术方案,供应急指挥负责人员使用。应对方案中建议明确启动应急预案的检查表,检查关键业务系统的运行情况和应急切换准备工作就绪情况。并明确各预案的应对事件描述、处理方案简述、处理方案步骤等信息。
应急预案的操作手册
针对各个预案的操作步骤,每个应急恢复小组要制定有针对性的恢复操作手册,该手册应详细到命令级,用于指导具体的恢复操作。此操作手册应该包含各预案涉及人员清单、联系清单、应急操作的详细步骤,供具体员执行人员成员使用。
2)应急响应服务
故障级别定义
一级(P1):硬件、网络故障、数据库崩溃、病毒、黑客入侵等,导致应用完全不可用,或者大部份功能丧失,或对大部份最终用户的业务使用有严重影响,需要立即采取措施进行处理;还包括医院要求作为一级故障处理的其它情况。
二级(P2):硬件、网络故障、数据库崩溃、病毒、黑客入侵等,导致应用部份功能丧失,性能降低,严重影响和限制了应用系统的使用与维护,或对部分最终用户的业务使用有较大影响的故障。
三级(P3):硬件、网络故障、数据库崩溃、病毒、黑客入侵等,导致应用部份出现瓶颈,性能下降,但最终用户大部分业务操作仍可正常进行。
四级(P4):硬件、网络故障、数据库崩溃、病毒、黑客入侵等,导致应用部份性能下降,但功能正常,对最终用户的业务运作几乎无影响。
服务时间要求
故障等级
|
应急响应时间
|
到达现场时间
|
恢复系统时间
|
排除故障时间
|
一级
|
<5分钟
|
<30分钟
|
<1小时
|
<2小时
|
二级
|
<15分钟
|
<1小时
|
<2小时
|
<4小时
|
三级
|
<30分钟
|
<2小时
|
<2小时
|
<4小时
|
四级
|
<1小时
|
<3小时
|
<4小时
|
<4小时
|
Ø 响应服务流程