数字化灾难!2016年九大服务停机事故总结

发布时间:2023-05-07 06:47:16 作者:tflx 阅读量:4787

服务器宕机一直是业界关注的焦点,我们该如何确保自己的品牌不会受到停机事故的负面影响呢?这确实是个值得思考的问题。

  停机事故

  2016年发生的一系列停机事故已经导致众多知名品牌遭受严重损失,其商业信誉与消费者信心亦因此受到重大打击。发生停机事故的主要原因之一在于计划外的系统配置变更,这通常是因为即时bug或者潜在系统安全漏洞修复意外引发了更为严重的问题。

  为了避免发生计划外停机,我们将在这里回顾过去一年中出现的那些最为严重的服务停机事故,希望能够以此为鉴指导新一年中的业务连续性保障工作。

  美国西南航空

  去年10月,836条西南航空航线遭遇延误,而根源在于该公司航线技术系统中的问题。根据该公司介绍,技术人员不得不全力修复主要系统并利用备份规程以帮助客户及其托运行李正确到达目的地。

  达美航空

  达美航空公司证实,亚特兰大当地的一次电力中断影响到其凌晨时开始进行的系统更新,并最终导致计算机系统瘫痪以及大量航班延误。该公司同时警告称,当周一其被迫因此取消大量航班,且机场屏幕及其它飞行状态系统将无法正常显示航班相关信息。

  根据统计,此次时长达5小时的停机共造成2000次航班取消,总体损失估计达1.5亿美元。

  Salesforce

  这家云应用厂商在其官方网站上指出,其NA14实例上的一套数据库出现文件完整性问题,并导致超过12个小时的服务停机事故。

  根据统计,由此次停机造成的经济损失约为2000万美元。

  苹果

  去年6月,苹果公司放下的iCloud、App Store、iTunes以及Apple TV等一系列互联网服务发生长达9小时的停机事故。另外,去年12月初用户们亦发现其暂时无法登录自己的iCloud账户。

  Slack

  去年6月,高达300万用户在2小时内由于Web服务器过载而无法正常访问Slack。

  该公司目前正在就如何避免再次发生类似问题而进行讨论。

  身份是解决问题的关键

  为了避免发生停机事故,IT运营团队应当对现有服务进行分层,同时将系统身份识别作为业务中的关键性因素。其中顶级应用应是那些与业务成败直接关联的重要应用,例如销售点、票务或者计费等功能相关的应用。

  为顶级系统制定故障切换计划

  高可用性水平不可能自然实现,我们必须为其做好规划及实施。具体而言,高可用性立足于系统架构中的各个方面。顶级系统需要切实配合故障切换计划,同时利用额外负载容量处理意外出现的负载峰值。

  投资建立高水平监控堆栈

  如果无法把握服务的当前运行状态,那么保证其运行状态也将成为痴人说梦。事实上,准确了解IT系统运行状态的惟一途径就是在堆栈中的各个层面上引入一流监控工具(例如系统监控、应用监控、Web与用户监控、日志记录以及错误追踪等方案)。目前IT行业正积极利用这种分层式功能独立方案取代原有的整体式服务监控机制,从而适应持续提升的IT系统复杂性与动态水平。

  在警报机制内区分有效信号与干扰信号

  工具数量的增加同时意味着我们需要面对更多干扰信号。为了有效识别、分类并解决潜在问题,IT团队必须找到可行方式以正确进行有效信号与干扰信号分离。通过采用警报关联解决方案,IT团队将能够了解各监控工具的警报信息间存在哪些联系,从而快速过滤掉非关键性问题,最终集中精力处理最重要的风险因素。

  

***本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。

我要评论

最新文章

 2023-12-25 22:44:35   admin

活动发布区版规

 2023-05-27 22:03:52   御风而行

容器、无服务器、虚拟机:安全性差...

 2023-05-27 19:08:41   小绵羊0123

科技巨头布局云端 服务器 网络硬...

 2023-05-27 18:17:46   姐姐的跟屁虫

钉钉因系统访问流量激增,宕机1小...

热门阅读

 2022-07-23 00:34:02   freeatom

常见ftp命令 FTP命令使用详...

 2022-07-21 02:17:02   ares

双硬盘组建Raid0磁盘阵列图文...

 2022-07-20 06:17:02   mankeung123

用友软件客户端连接不上服务器的解...

 2022-07-23 00:51:02   antonfxb

WebService实例

 2022-07-13 05:38:02   苯小孩

开发、运维不可不看的Linux调...

 2022-07-20 18:51:02   nightstone

如何使用Charles抓取Web...

随机文章

 2021-12-30 05:38:01   xxmsian

双线服务器托管上数据中心

 2022-01-10 05:38:03   max_uo

从云计算到云端架构迁移之路

 2022-01-15 05:38:02   二图

我应该选择双线双IP机房还是双线...

 2022-07-06 05:38:02   9999999999999

7个有效的物联网应用案例

 2022-07-19 08:17:02   dannycjr

服务器配置:通过IIS配置FTP...

热评文章

 2022-07-19 20:17:02   dengyu0429

linux vi使用及详细介绍

 2022-07-20 01:00:05   激动的舌头

Linux视频教程:用户管理命令...

 2022-07-21 20:51:02   jessica-an

创建本地FTP站点

 2022-02-07 05:38:03   jasonkidd

WEB服务器配置详解

 2022-07-20 04:51:02   wolfssss

ACL权限-默认与递归(4)

 2022-07-22 15:00:05   淡水珊瑚

Linux下 Samba Ser...
全球云服务器
Catfish(鲶鱼) Blog V 4.7.3