企业三大宝——容错,高可用和灾备

最近除了新冠病毒,另一个沸沸扬扬的事件就是微盟的“被删库跑路”了。企业在看到微盟积极处理后续事件的同时,心里也敲响了要早做“灾备中心” 的警钟。除了灾备,企业还关注容错率、高可用率,容错、高可用和灾备被称作企业的三大宝,那么这几者之间存在着怎么样的联系呢?

5.jpg

一、容错指的是, 发生故障时,系统还能继续运行。比方说,一架飞机有四个引擎。假如一个引擎坏了,还剩下三个引擎,飞机还能继续飞。这三个引擎这就是“容错”。同样的,汽车的一个轮子扎破了,剩下三个轮子,也还是勉强能行驶。所以,容错的目的是,发生故障时,系统的运行水平可能有所下降,但是依然可用,不会完全失败。

二、高可用指的是,一套系统能够更持久地保持一定的运行水平。比如汽车的备胎就是一个高可用的例子。如果没有备胎,轮胎坏了,车就开不久了。在这个情境下,备胎延长了汽车行驶的可用时间。同时要注意,高可用不是指系统不中断(那是容错能力),而是指一旦中断能够快速恢复,即中断必须是短暂的。如果需要很长时间才能恢复可用性,就不叫高可用了。上面例子中,更换备胎就必须停车,但只要装上去,就能回到行驶状态。

三、灾备指的是, 发生灾难时恢复业务的能力。

灾备被放在最后,但占的分量可一点都不低。近年来,灾备中心同城双活两地三中心等都是十分热门的灾备方案。

灾备的目的就是,保存系统的核心部分。一个好的灾备方案,就是从失败的基础设施中获取企业最宝贵的数据,然后在新的基础设施上恢复它们。注意,灾备不是为了挽救基础设置,而是为了挽救业务。

企业有了以上三大宝,就可以形成一套优质的系统,最终促成企业的良性循环。