推广 热搜: 集成  系统集成  弱电  软件  服务器  kvm  思科  拼接  视频会议  SFP 

微软Azure云计算全球宕机说明了什么

   日期:2014-10-28     来源:比特网    作者:songjiayu    浏览:110    评论:0    
核心提示:据报道,8月18日,从美国东部时间下午2:00/太平洋时区上午11:00开始,世界各地的用户开始报告微软的Azure虚拟机、网站和其他的云服务出现了问题。

据报道,8月18日,从美国东部时间下午2:00/太平洋时区上午11:00开始,世界各地的用户开始报告微软的Azure虚拟机、网站和其他的云服务出现了问题。

微软发言人Kristi Lewandowski表示:“我们已经发现Azure服务的中断问题,包括虚拟机、云服务、网站、自动化操作,正在与工程师团队一起努力,尽快解决这个问题。”

究竟如何看待云服务中断的问题呢?其实,云服务并不意味着万无一失,它和所有的IT系统一样,仍然会有故障的发生,这很正常。不要说云服务,即使银行的两地三中心,也没有完全杜绝故障的发生,所以说,云服务不代表绝对的安全。

但云计算安全性也不是不堪一击,与多数行业/企业数据中心相比,由专业人士运维的云计算服务安全性和可靠性要高出很多。对于此次Azure云计算全球宕机,很遗憾没有见到事故分析的详尽的报道,所以对于事故原因无从说起。

大致想想无外乎几种原因,一是数据中心基础设施的原因,如供电、制冷等导致的中断。对于机房基础设施来说,供电和制冷都有严密地保护措施,如供电的2N系统设计,有双路市电、双路UPS,以及柴油发电机的保护,故障概率不高。但也不能够排除百密一疏,曾经有数据中心电缆沟发生火灾,运维人员只能眼巴巴地看着UPS电池耗尽,最终导致供电中断。但在此之前,运维人员可以通知用户即将发生的宕机,将损失尽可能降低。但数据中心等级越高,意味着运维成本越高,这些成本都需要用户来消化。

第二方面的故障有可能来自IT系统,服务器软/硬件都有可能,类似太平洋电缆被挖断这样的天灾,云计算数据中心其实是很难应对的。还有其他的原因,就是容灾措施失效,或者没有采取更多的容灾措施。

所以,故障基本是无可避免的。也许有人会说到SLA(服务水平协议),我觉得这就像买房时我们签订的合同,SLA也不是想怎么签都可以的,依靠SLA避免不了事故的发生。那么,对于用户来说,如何才能减少宕机事件的影响呢?一是尽可能采用容灾的措施,购买云服务也要考虑容灾问题,小到设备,大到两地三中心。二来就是保持一个健康的心态。

可以试想一下,与Azure的运维技术相比,你的运维水平如何?就连微软也搞不定的,我们就能搞定吗?尽人力,听天命,发生个把故障很正常,对吗?

 
打赏
 
更多>同类资讯
0相关评论

 
推荐资讯
点击排行

网站首页  |  付款方式  |  版权隐私  |  使用协议  |  联系方式  |  关于我们  |  网站地图  |  排名推广  |  广告服务  |  RSS订阅  |  违规举报  |  京ICP备11008917号-2  |