5月29日早间,腾讯财经从携程处获悉,28日11点开始的携程PC及APP的全面瘫痪,实则由携程内部员工的错误操作导致。“经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。”携程方面称。
携程方面再次强调,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损。
对于如何杜绝此类事件的再次发生,携程方面表示,“在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作”。
携程的瘫痪始于28日上午11时09分,按照此前的携程官方说法,“部分服务器遭到不明攻击,导致官方网站及APP暂时无法正常使用”。腾讯财经从携程内部人士处获悉,这是携程遇到的第一次数据库大规模问题。
经过近12小时的抢修,28日22:45,“除个别业务外,携程官方网站及APP恢复正常”。对于恢复时间过长的疑问,携程方面将此解释为大型网站繁多业务背后的系统复杂性。
“一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。”携程解释说。 发生事件后,携程的技术人员除了恢复生产服务器上的执行代码外,还需恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
携程方面称,“这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。”
对于此次误操作,市场有传闻称是携程内部具备高级权限的离职员工的报复性行为。不过,携程方面称,“还在调查”。
版权声明:
本文由 德云社区 整理,原文来自网络。
|