当前位置:首页 >  IDC >  安全 >  正文

从Azure云服务故障中我们能学到什么?

 2018-09-17 16:17  来源: 互联网   我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

Azure遭雷击后业务停摆

本月初,Azure因遭遇雷击,造成长时间的业务停顿。随后又因为服务器宕机,而再次暂停2小时服务。是否因为Azure“流年不利”?其实业内人士都了解,这只是意外,而我们无法预测意外什么时候会发生,就跟无法预测会因为什么而发生意外一样。

对于事故勇于承担并予以解决无疑是令人欣慰的。

Azure的工程部主管说“首先,我想对受影响地区的托管客户为长时间的VSTS故障及其对全球客户带来的影响深表歉意。这起事件对我们来说前所未有。在我们七年的历史中,这次故障是VSTS客户遇到持续时间最长的。我通过Twitter、电子邮件和电话与客户沟通,客户的团队至少有一天无法正常办公。我们让客户失望了。这是一次痛苦的经历,为此我道歉。”(译文来源于“云头条”)

随后,Azure对自身的服务设置、备份方案、硬件设施、人员维护等进行了一系列的调整。虽然这些调整也许在未来并不能避免所有意外的发生,但至少能够减轻事故带来的不良影响,减少造成的损失。

我们从中能学到什么?

人类有喜欢成功、畏惧失败的天性,还因此而绞尽脑汁地设计了许多“完美模型”想避免失败。事实上,因为迷信“完美模型”而吃的大亏很多,比如:“泰坦尼克号”曾被认为是“不可沉没”的;马奇诺防线也被称作是“不可逾越”的;在发生核泄漏之前,每个核电站都声称自己的安全系统是“万无一失”的……

意外的发生,最大的好处就是让我们更加进步。因为游轮爆炸污染海面而对石油运输的安全设施重加考虑,因为核反应堆发生意外而改善核反应过程和安全设施,因为发现上万种不适合做灯丝的材料后而找到钨丝……

于是,我开始思考,从Azure的事故中我们能学到什么?

我首先想到的是:“有备无患”的态度。在容灾备份这个行业,每年都会发生若干或大或小的IT事故,比如:某公司员工误删数据了、某医院服务器宕机业务停顿了、某学校被勒索病毒攻击了、某单位丢失数据了,等等。在遭遇意外之后,结果如何就跟“有备无患”的态度大大相关了。

这里举个不久前的例子,今年7月中旬,重庆市南岸区人民医院因意外断电2次,导致医院His系统数据库发生逻辑故障,无法正常启动。

数据库逻辑错误故障截图

作为二甲医院,重庆市南岸区人民医院早就为His系统部署了容灾备份软件,来以防万一。因此,在故障发生后,在容灾备份软件厂家北京和力记易科技有限公司西部大区技术工程师的协助下,利用备特佳软件的“任意时间点回退”功能,一次性成功恢复数据,解决了数据逻辑故障问题,经校验,数据完全一致,His系统恢复正常使用。

有了“有备无患”的态度,之后,自然是想要“鱼”与“熊掌”能够兼得。

大多遭遇IT故障的客户,在面对故障会持续多久没有明确结论的时候,都面临着一道“鱼”与“熊掌”的选择题,是要马上恢复业务,还是要保证数据不丢?其中一些客户,他们不想丢失任何数据,只要能恢复数据,不管这个过程有多长。而另外一些客户,需要让庞大的团队迅速开始工作,哪怕丢失部分数据也认了。

这个选择在构建容灾备份方案的时候也会遇到。一方面是数据的100%备份与恢复,一方面是业务的连续性,“鱼”与“熊掌”如何兼得?

作为国产容灾备份软件厂商,北京和力记易科技有限公司早就已经开始思考并解决了这一问题。和力记易自主研发的备特佳容灾备份系统,以CDP持续数据保护技术为核心,实时监测数据变化并备份,数据变化传到备份机以后,一份与以前的数据实时覆盖,形成一份最新的及时可用数据,另外一份以自有格式存储。备份机上这份及时可用的数据与生产机上的业务数据完全一致,如果生产机意外宕机,备份机完全可以代替生产机继续对外服务。而以自有格式存储的数据,可以在遭遇IT故障后,用于数据的任意回退,就像前面举例说明的那样。既能保证数据安全,又能保障业务连续,“鱼”与“熊掌”也可得兼。

编者语:

遭遇故障并不可怕,从中学习,好的保留,不好的就改变,我们会一直走在进步的路上。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 强强联合!百望云入驻微软实验室,揭开数智发展新篇章!

    OpenAI是什么,随着ChatGPT的爆火,相信大家都并不陌生了。而微软也第一时间推出了AzureOpenAI加速计划,希望凭借OpenAI的卓越能力,为企业赋能,帮助越来越多的企业将AI大模型的基础能力,与企业场景相结合,开拓新的商业范式,引领行业变革。近日,以“智领新变共创未来”为主题的“微软

    标签:
    云服务
  • 新成果、新服务、新生态,HPE混合云领导者地位再提升!

    HPE扩大混合云和私有云产品的覆盖范围、灵活选项和创新功能,领导者地位再提升!HPEDiscover科技盛会上,HPE宣布了HPEGreenLake边缘到云平台、混合云服务、私有云产品组合的创新成果,以及合作伙伴生态系统的最新进展:·HPE完成对OpsRamp公司的收购;相关解决方案现已作为HPEG

    标签:
    云服务
  • 权威发布!白山云连续入选IDC边缘云报告

    近日,国际权威研究机构IDC发布《中国边缘云市场跟踪研究,2022H2》报告。作为创新的全球边缘云服务提供商,白山云得到IDC的持续关注与认可,凭借在边缘云领域的技术突破、产品迭代以及场景实践,再度入选报告,与行业伙伴一同撑起边缘云市场的巨大价值空间。IDC指出,在服务商与客户需求的共同推动下,边缘

    标签:
    云服务
  • 带来高校混合云建设方案,青云科技满足教育、教学、教管等场景需求

    随着教育信息化2.0进程加快,教育部等六部门提出“推进教育新型基础设施建设,构建高质量教育支撑体系”,建设智慧校园成为各大高校重点布局方向。但因为传统竖井式建设模式,导致高校信息系统庞大,现有信息化程度较低,IT资源碎片化,资源统一管控难度大等一系列问题,使得智慧校园建设步履维艰,各大高校亟需找到突

    标签:
    云服务
  • 多功能升级、超值优惠!KubeSphere Cloud加速企业云原生应用落地

    5月份,青云科技(qingcloud.com,股票代码:688316)推出的KubeSphereCloud云原生应用服务平台实现了众多功能升级,并为用户提供众多优惠活动,加速企业落地云原生。详情如下:功能升级集群巡检服务支持配置定时巡检策略随着企业核心业务环境安全事故的频发,周期性完成集群健康巡检任

    标签:
    云服务

热门排行

信息推荐