企业部署灾备中心的意义

经过调查,对于数据中心而言,不同灾难发生的概率是:硬件故障占比44%,软件、人为、病毒等故障占比49%,自然灾难和社会灾难仅占7%。对于硬件故障或者软件、人为、病毒等故障来说,需要的都不是远程的灾备保护,本地的数据保护就已足够。只有剩下的7%的自然灾难和社会灾难,才真正需要异地远程灾备。也就是说,通过双机热备、本地备份、CDP这些在线/近线的数据保护手段,基本能够解决93%的系统故障。而不论是数据级还是应用级的异地灾备中心,应对的都是7%的较小概率事件。

广渠门2.jpg

虽然异地灾备中心的目标是应对小概率事件,但异地灾备中心事关我们能否迅速从区域性的突发事件中扭转困局并迅速恢复业务。作为预防小概率事件的异地灾备中心,其投入产出比需要进行细致的分析及规划。一般而言,应用级灾备的投资金额约是数据级的2-4倍。而且每一次生产中心与异地灾备中心之间的切换都需要耗费的大量人力、物力和时间。

相对于应用级灾备中心而言,数据级的投入产出比会更好。与其建设昂贵的异地应用级灾备,不如做好本地的双数据中心保护,再配合远程的数据级灾备。因此,在现实环境中,“本地CDP+远程数据级灾备”是比较常见的数据保护模式。

灾备中心建设需要循序渐进,分级建设

晓月苑数据中心2.jpg

异地灾备中心的建设投入很大,不能一蹴而就。数据级灾备是应用级灾备的基础,应用级灾备是数据级灾备延展,两者并不冲突。很多用户在建设灾备系统时,会先做数据级灾备,后续再扩展成应用级灾备,应用级灾备提供比数据级灾备更高级别的业务恢复能力。分步骤完成数据级灾备至应用级灾备的方案,具备如下优点:

一、与异地应用级的灾备相比,异地数据级灾备的投入比较小,却可以在极端情况发生时起到作用。在出现如地震等大面积的自然灾害的情况下,用户是可以接受一个相对比较长的业务恢复时间,外界也会有较大容忍度。有了异地数据备份后,就可以用几天或更长一点的时间来恢复业务,而不至于彻底瘫痪。

二、灾备中心建设不是一个简单的技术方案,而是一项系统工程,灾备中心的基础建设、IT系统需要一个逐步建设的过程,运行维护团队和技术支持能力需要长期培养锻炼才能具备理想的应急能力。因此,先做数据级灾备,积累建设经验,培养灾备队伍,具备相当的能力之后,再建设应用级灾备系统就会容易很多。

三、在从数据级灾备向应用级灾备过渡的过程中,还要根据业务系统的重要性按需划分灾备等级,不必全部业务进行灾备。如:即使在同一个单位或者部门内,也存在多个应用系统。这些信息系统的重要性、复杂度都各不相同,对应的是否需要进行灾备也不相同。因此,需要根据业务系统的实际需求来逐个确定灾备等级。一般而言,“2/8原则”是比较常见的,也就是20%的应用是关键和核心的,需要应用级灾备。80%的应用是非关键的,数据级灾备则足够。在实际的异地灾备中心建设中,这种应用级和数据级混合的建设模式是最典型的。

由于灾备所承担的是用户最关键的核心业务及数据的存储,其重要作用勿庸置疑。灾备中心的建设涉及到众多技术以及众多厂商的各类解决方案,其复杂性也不言而喻。而且建设一个数据中心在耗资巨大的同时,也需要耗费大量的人力、物力及时间。

对于同城多活或异地灾备中心而言,为避免一次性大量资金投入,并获得高等级、高可用及专业的数据中心服务,一般情况下,均采用数据中心外包的形式达到自身的应用目的。