携程等被打脸,别光看热闹,你学到了吗?

巨头们被一大波安全事件打脸,宕掉千万美元

5.28也就是昨天中午,刚刚吞下艺龙的携程网官方网站及APP无法正常使用,酒店、机票预订等核心业务全面暂停。这是进入5月以来第三个遭遇突发而无法提供服务的知名网站。往前数,5.27支付宝全面瘫痪2.5个小时。5.11网易产品宕机,网易新闻客户端、网易云音乐及众多游戏等均出现登陆故障。再往前数: 2月团购网站拉手网陷乌龙门;朋友圈以及信息接收均出现问题;14年大众点评、1号店等先后大面积用户信息泄露。

宕机12小时股价暴跌11%,按照携程一季度财报曾披露的数据,宕机的损失为平均每小时106.48万美元,按此计算,携程此次直接损失1277万美元。而网站接二连三出故障带来对其品牌公信力的影响,更是金钱无法衡量。

一千个瘫痪的理由,你的公司会中招吗?

携程在5.28晚11:21发布事故官方原因:由于内部人员误操作,删除了生产服务器上的执行代码导致。支付宝官方对故障回应称“由于杭州市萧山区某地光纤被挖断,……”。网友们对官方回应均表示:呵呵!

同时,若干理由猜想在网上纷飞,有不靠谱的,如“去哪儿雇佣黑客攻击”;也有听起来很像那么回事的,如“有专家提出极大可能是内部人员所为,黑客从外部攻击很难做到数据大量丢失,且备份还原不至于需要12小时之久。通常黑客入侵往往只是悄无声息地拿走核心数据,一般不会进行破损性操作,所以排除外部攻击。但是对内部误操作,大伙都不相信一个不小心会造成如此大的杀伤力。而极大可能是离职人员的恶意报复,破(chi)解(you)了公司内部密码和验证条件,放置了某些恶意程序。”

无法证实的猜想,必须看透的原因

这样的事件,很难得到一个官方确认、大家伙也认可的解释。甚至这个真实的原因也并不真正重要,重要的是看到现象背后的原因。相信一位曾供职若干巨头的人士的以下看法会得到多数IT人的认同:

“我记得当初在1号店负责运维时,因为1号店被沃尔玛收购,作为上市企业的关联交易公司,当时沃尔玛派KPMG来做详细的审计,核心岗位和管理层都被做了访谈,并出具了详细的操作流程,我亲自参与这个过程,审计是做了,但我们作为执行人心中是非常没有底气的。在我呆过的几个大的互联网公司如腾讯、盛大和1号店,都有做数据管理流程和备份恢复服务,但是因为这些安全业务比较边缘,在整个公司关注程度很低,并没有落到实处。

我有理由相信,所有的公司都有做数据管理和备份,不论是小微企业老板自己手动用U盘或者硬盘拷贝、还是大的互联网公司有专门的运维人员专项负责、传统的中大型企业用专业的软硬件工具,关键是99%的公司都没有做数据管理流程、备份和恢复的演练,恢复的数据到底可不可用,如何快速的恢复等操作演练。

再来看看欧美环境,再小的一家公司,都有专业的数据管理软件或者专业的IT维护人员,他们极其重视数据,视数据为企业生命。”

简单总结成一句话:公司不重视,人力配备和资源投入不足,安全管理很多并未落到实处。

行业老大纷纷栽坑,企业和IT人该怎么做?

教训都是宝贵的经验,这一大波事件中必须吸取的有两点:

  • 业务发展是首要,安全等其他管理要跟上,否则“出来混,迟早要还的”;
  • 内鬼危害堪比黑客,攘外先安内,《论语.季氏》中有曰“吾恐季孙之忧,不在颛臾,而在萧墙之内也。”说的也是这个道理。

说到做好安全管理,责无旁贷的自然是IT部门,那么问题来了,刚才已经总结出不被重视的现状,面对头顶的大难题,IT部门、IT人怎么能施展拳脚?其实这也是IT人怨言最多的问题之一,有人可能会说“做不好也是公司受损,不重视还做什么?!”一位做IT的小伙伴认为“网络/系统运维、信息安全部门的人,以后找工作都不好说自己这段时间在携程干过”,可见公司与个人在某种程度上是共荣共辱的。

在小编在与众多出色的IT人打交道的过程中发现,他们能够理解事情不会一蹴而就,也不会以“上头不支持、公司不重视”为理由让项目搁浅,他们像过河的卒子,一步一步向前推进。他们根据面临的具体问题找出具体的解决方法,假以时日,取得了很多人难以想象的成绩。针对阻碍安全管理推进的各种具体难题,小编将在接下来逐一来整理方法供大家借鉴、与大家讨论。

 

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注