服务

力求专业与交互的完美契合,以规范的流程和专注的态度,为您提供全方位的技术服务。

服务

灾难与业务连性服务

一、灾难性定义
(一)定义
灾难(Disaster)是导致重大损失的突发的不幸事件 (Unplanned Calamitous Events),包括:
  自然的(Natural),如地震(Earthquakes)、洪水(Floods)、强对流天气(Storms)、火山爆发(Volcanic Eruptions)、自然火灾(National Fires);
  系统/技术的(System/Technical),如硬件、软件中断(Outages)、系统/编程错误(Errors);
  支持系统(Supply Systems),通讯中断、配电系统(Power Distribution)中断、管道破裂(Burst Pipes);
  人为的(Man-Made ),爆炸(Explosions)、火灾(Fires)、故意破坏(Purposeful Destruction)、航空器坠毁(Aircraft Crashes)、有害物质泄漏(Hazardous Spills)、化学污染(Chemical Contamination)、有害代码(Malicious Code)、恐怖袭击(Terrorist Attacks)、骚乱(Riots)、罢工(Strikes)。
 
(二)特征
对于机构来说,任何导致机构关键业务功能(Critical Business Functions)在一定时间内无法进行的事件都被视为灾难,其特点表现为:
– 计划之外的服务中断
– 超期的服务中断
– 中断无法通过平常的事件管理程序得到解决 
– 中断造成重大损失
中断事件是否被机构视为灾难,与中断所影响的业务功能对机构的关键程度,以及中断的时间长短有关。
(三)原因
• 85% 的系统未进行备份 
• 53% 的故障是由硬件或软件造成的
• 38% 的损失源于人为错误
(四)损失
(五)后果
• Gartner分析报告:
–  2/5公司经历大灾难后再也不能恢复运作 
–  1/3公司经历大灾难后在2年内倒闭
• 明尼苏达大学研究:
–  两周内不能恢复运作,75%企业完全停顿 
–  两周内不能恢复运作,43%企业再无法恢复
二、业务连续性定义
(一)定义
业务连续性是指核心业务系统应对风险具有自动调整和快速反应的能力,以保证业务的连续运转,主要包括以下内容:
1)业务连续性计划BCP( Business Continuity Planning )
是一种策略规划,当灾难发生时致使企业主要业务或服务中断时,业务连续性计划可确保迅速恢复主要业务的正常与持续运作。业务连续性计划不仅包含计算机系统的恢复计划、还包括关键业务的持续运作计划,如恢复组织、人力资源、对外沟通等。
2)灾难恢复计划DRP ( Disaster Recovery Planning )
对企业的信息系统进行相应的冲击分析及风险分析并将其量化,以确定IT系统面对灾难事故时的预防和恢复策略,开发并制定相应的IT系统恢复计划、管理方法和流程,以减轻灾难对于企业IT系统的不利影响。


 
(二)保障体系
业务连续性保障体系由高可用系统、容灾系统,数据备份系统、应急管理体系、安全管理措施以及运维服务团队组成,相互配合共同保证整体业务连续性以及灾难的可恢复性。
1、高可用系统:采用现代高可用技术,如Oracle RAC集群技术、SQL Server 的AlwayOn集群技术、MySQL的Cluster集群技术、Mycat分布式数据库技术、Oracle的ExaData一体机技术、虚拟化技术、超融合技术等组成高可用系统,实现负载均衡及故障转移,最大程度的保护业务系统的连续性。
2、容灾系统:是建立在异地容灾中心的一套整体生产系统恢复体系,在发生重大灾难故障时,通过启动容灾系统可以全面接管生产系统,实现业务系统连续性,容灾系统包括本地容灾、异地容灾、两地三中心、双活中心、多活中心等。
3、备份系统:在不影响正常业务运营的前提下定时将系统各种数据(包括操作系统、数据库、业务数据文件等)备份到磁带或专用存储,实现基础数据容灾。目前比较通用的备份系统有TSM及NBU等系统。
4、应急管理体系:是最关键业务快速恢复的手段,在生产系统高可用失效的情况下,通过应急管理体系可保证最关键业务的连续性,应急管理体系包括应急措施及应急演练等方面内容。
5、安全管理措施:有效的安全管理制度和安全措施,能够最大程度的降低人为因素的灾难发生,是确保业务连续性的关键。安全措施包括安全管理制度、风险分析、风险评估、威胁分析、系统加固、完全防护等
6、运维服务团队:任何技术手段、安全措施均离不开人的因数,因此,拥有专业素质的运维团队,是业务连续性保障的基础。
(三)业务连续性指标

级别 恢复时间要求(RTO) 可容忍丢失的数据(RPO)
(1级) 2小时内恢复 无数据损失
(2级) 4小时内恢复 30分钟内的数据损失
(3级) 8小时内恢复 4小时内的数据损失
(4级) 1天恢复 8小时内的数据损失
(5级) 可恢复,但无时间要求 一天之内的数据损失 


(四)业务连续性管理规范
近几年,我国的一些行业主管部门从关系国计民生、社会稳定方面出发,也制定了一些适用于本部门或本行业的业务连续性管理指引规范。具有代表性的标准及要求如下: 
1 国家标准《信息安全技术 信息系统灾难恢复规范》GB/T 20988-2007
2 银监会《商业银行业务连续性监管指引》
3 银监会《商业银行数据中心监管指引》
4 银监会《商业银行信息科技风险管理指引》
5 证券行业协会《证券公司证券营业部信息技术指引》
6 保监会《保险业信息系统灾难恢复管理指引》
7 电监会《国家处置电网大面积停电事件应急预案》
8 民航业《民用航空重要信息系统灾难备份与恢复管理规范》
9 电信业《电信网和互联网灾难备份及恢复实施指南》
(五)影响业务连续性的分类
 


上一篇:没有了


Copyright © 2002-2017 富璟科技(深圳)有限公司 All Rights Reserved 备案号:粤ICP备17024733号-1