所在位置:首页>最新资讯>网游行业服务器故障盘点

网游行业服务器故障盘点

来源:作者:gaoxuan发表于:2017-01-19点击:

 
北京时间1月18日,由网易代理的暴雪旗下卡牌类游戏《炉石传说》遭遇了重大故障,从1月17日凌晨1点开始开始维护,直到1月18日下午18点才完成。而更为可怕的是,《炉石传说》的数据并没有恢复,备份数据库也出现了故障,因此这款游戏的玩家被迫回档到1月14日15点20分。
 
在《炉石传说》服务器故障的公告里提到:炉石数据库由于供电意外中断的原因而产生故障,导致数据库损坏。虽然暴雪与网易的工程师们已在事故发生后第一时间着手抢修,重启服务器病尝试数据恢复。但不幸的是,由于相关数据也出现故障,这些尝试均未成功。
 
网游业务有提供服务不间断,玩家众多,游戏进度等数据不允许丢失的特点,这对网游服务商在数据保护和业务连续性方面有着非常高的要求。除了这次的《炉石传说》服务器故障外,还有不少网游宕机事件,我们依照时间顺序一起来回顾下。
 
网易公司多款游戏及服务出现无法访问
 
事件:2015年5月11日晚间,网易旗下梦幻西游、镇魔曲、天谕游戏、等多款无法正常访问,有传言称出现故障的原因为网易大厦着火。网易官方发声明澄清称,2015年5月11日21时,因骨干网络遭受攻击,导致网易旗下部分服务暂时无法正常使用。
赔偿方案:网易个别游戏产品称将对玩家进行补偿,详细补偿方案未知。
 
群星眷顾等三组服务器异常
 
事件:6月15日凌晨,群星眷顾、森中怪鸟、巨齿豪杰三组服务器因服务器数据异常,6月14日22:00——6月15日临时维护之前,有过在线行为的猎人,可能会出现受到服务器异常的影响遭受损失。
赔偿方案:将对这三组服务器所有猎人发放40000银币作为补偿。
 
风云服务器异常
 
事件:2016年11月12日,风云服务器产生服务器异常问题,于异常期间內可能导致服务器有短暂回档问题产生。
赔偿方案:有在三国商城购买消费,系统重新发送物品,在大鸿胪进行领取确认。期间内在交易站购买消费,系统将重新发送代币完成。
Steam服务器故障事件
 
事件:Steam于12月23号开启了冬季特卖活动,不少玩家已经摩拳擦掌准备把心愿单上的游戏全部买光。然而就在活动开启后不到一天时间,不少玩家忽然发现Steam发生了重大故障,几乎所有服务都被停用。玩家不能开启在线模式,也不能购买任何游戏,只能开启离线模式。最重要的一点是:这次的故障是全球性的,全世界的Steam用户都受到了影响。很快有媒体爆料此次故障是因为黑客组织Phantom Squad对Steam服务器发起DDos攻击。
赔偿方案:未知
狮吼直播服务器宕机
 
事件:2017年1月14日,,由于机房施工事故导致服务器故障,狮吼直播客户端在20:00左右无法正常使用。
赔偿方案:受影响玩家可领取狮毛奖励补偿:用户在直播间 内观看直播时通过右下角红包领取的狮毛翻倍发放。
 
通过一系列游戏服务器故障事件,我们总结了一些几大原因:
1. 同时进入游戏的玩家过多,服务器负载过大;
2. 线路被挖,或断电;
3. 黑客DDOS攻击;
4. 服务器硬件出问题,例如服务器过热;
 
DBA是一个脑袋别在裤腰带上的活儿,不然也不会出现某公司为避免游戏公测时出现宕机而特意将服务器带到寺庙进行开光的营销事件。从《炉石传说》事件可以看出,1与18日事故发生,恢复到1月14日,正好周六,这是周末全备,这应该是传统的备份策略,如果对系统进行实时备份,通过CDP恢复到数据库最近的某一可用点,也不会导致玩家损失4天的进度数据。
 
此外,通过应用/系统高可用服务,一旦出现服务器故障或线路被挖,通过手动或自动方式进行业务切换(演练是宕机切换的保障)。
 
其他防止宕机及应对宕机的办法有:
 
设置负载阔值报警,一旦达到预警值,立马动态增加服务器配置,避免因为服务器过载而宕机;
定期检查硬件,进行设备监控,一旦出现过热等问题,立马解决;
和警方有良好互动,一旦有黑客攻击,立即报警;
做至少2份备份(本地+异地);
定期做应急演练(包含切换,接管,以及数据恢复);
每次备份完成后对备份完整性及可用性进行校验。避免真正需要恢复时才发现问题;
 

品牌案例

会员登录
  • 请输入用户名

    请输入用户名

  • 请输入密码

    请输入密码

  • 请输入验证码

    请输入验证码

  • 记住用户名