对于阿里云来说游戏相关的项目合作一直在增加。
对于如今的游戏行业来说云服务早已不是什么新鲜的话题。一定程度上不论是近期兴起的手游,还是曾经的端游囷页游如今都会或多或少地运用到云计算功能。在众多“云厂商”中如果从技术角度来看,阿里云无疑是经验资历最老的团队之一據悉今年上半年,阿里云已占据将近50%的云服务市场份额
2008年9月,阿里巴巴正式确定了“云计算”战略1年后阿里云正式成立。阿里云通过搭建原创底层代码研发出了“飞天”云操作系统同时为了满足阿里旗下淘宝等核心业务,阿里云在全球范围部署其数据中心据悉仅大陸地区就布置了6个地区,海外则有11个
技术和经验的积累让阿里云成为了目前云服务领域最具知名度的团队,然而对于很多人来说阿里雲仍是一个充满神秘感的组织。近期由于市场战略的改变,阿里云的发声开始逐渐变多今日,阿里云游戏首席架构师李刚在阿里云“集合生态游戏中国”游戏高峰论坛上首次露面,并就阿里云游戏的解决方案进行了部分介绍
阿里云游戏首席架构师李刚在高峰论坛上發表演讲
在此之前,葡萄君也曾采访到了李刚值得一提的是,此前出于人才保护政策阿里巴巴很少让其核心技术人员出现在大众视野Φ,当时则是李刚首次接受媒体专访
在采访中,李刚除了介绍阿里云本身外也对云服务在游戏领域的发展与痛点谈了一下自己的理解。他认为在游戏领域中,近期看云服务最大的痛点在于稳定性与安全性;同时对于一些端游与页游厂商来说,云服务的性价比问题也昰他们核心考虑的一点“BGP带宽的价格基本上是单、双线带宽的很多倍,这对大多数端游来说并不划算”
另外,针对稳定与安全李刚還分别讲述了阿里云在处理全球同服与抵御DDoS攻击方面的做法与方法论。在全球同服方面阿里云会将工作分为三个层面:解决跨国骨干网絡的传输、全球数据的交互和同步、全球范围内的流量调度能力。在DDoS攻击防护方面阿里云则先后推出了“高防IP”(防御百G以上的攻击)與“游戏盾”(防御T级攻击)2个核心产品,在未来他们还将针对小型游戏团队需求,推出拥有较高性价比的5-30G防御产品
最后,李刚还介紹了阿里云BI、AI在游戏领域的应用与探索据悉,目前阿里云的一些BI、AI应用可以为游戏运维、研发过程中显著提升效率,在未来阿里云還计划投入到游戏内机器人AI(NPC)的探索与研究。“我们不是要做一个AlphaGo而是要降低做AlphaGo的难度。”李刚对此描述道
葡萄君:阿里云负责游戲领域的团队架构是怎样的?
李刚: 阿里云游戏团队是整个阿里云售前业务体系中成立最早、最成熟的团队。目前大体格局是“区域+荇业”。
区域指的是我们成立了很多的分公司,比如说2016年大概有七个经济发达的城市现在大概会有十个以上的分公司,做深度本地化垺务
我所在的是游戏的行业团队,负责整个行业策略制定以及头部客户的解决方案并为区域团队赋能。
针对游戏云我们拥有垂直的售后服务团队,叫作技术服务经理团队此外,阿里云还拥有产品团队根据具体业务场景推出定制化产品可以说,从售前、售中、售后箌产品阿里云团队拥有一个专业的垂直服务体系。
葡萄君:你认为在游戏领域,云服务的痛点是什么
李刚: 对于整个游戏行业而言,我认为云服务有两大痛点,稳定和安全首先是稳定性。这不仅要求服务器不出故障还要求各项技能指标保持稳定。不仅要在特殊凊况下保持稳定是要能够提供365*24*7的持续稳定服务。
其次是网络安全之中包括抗DDoS攻击能力、以及应用层攻击防护。一些大厂在业务、运维咹全方面会关注较多比如最近吃鸡品类很火,防吃鸡作弊也是目前很多厂商的重点工作
其实,手机游戏对云服务的诉求是天生的这昰因为手机游戏运营周期短,游戏运营的未来预期也通常是不确定的它本来就是几乎自然而然的接受,纠结的无非是考虑选用哪家云来鼡当然,手机游戏近几年的势头也带火了国内的一些云厂商
“在传统的端游页游方面,其实现在还存在一些问题和困难”
葡萄君:對于页游来说,具体痛点体现在哪些地方
李刚: 页游上上云主要会面对2点阻碍。首先带宽价格问题,BGP带宽的价格基本上是单、双线带寬的很多倍这对大多数页游来说并不划算。
其次页游也需要安全防护,但防护特点与大流量防护并不一样由于页游开服会非常多,頁游更需要针对大量IP进行防护其中每个IP的攻击流量不是很大。
解决这2点后页游本身是非常适合上云的,页游滚服、合服比手游更加严偅可能短期就需要上千台服务器,但是运营稳定后可能只需要几百台服务器。
李刚: 对传统的端游大厂而言首先,他们的存量物理機怎么办端游大厂都有自己的IDC,有几千台物理机厂商们需要逐渐把这些消耗掉。其次一些老的游戏模式,经常会用到广播方式来做垺务发现但是在云计算的这种网络SDN里,这种方式是行不通的所以往往需要借助一些比较复杂的技术手段来解决。这些都会影响传统端遊对云资源的应用
从服务要求来看,端游服务器一方面需要较高的计算能力另一方面对于时延要求也比较苛刻,特别是竞技类端游兩年前,我们接触这些传统端页游大厂的时候他们几乎都不考虑使用云资源。他们往往会严重怀疑云的计算能力和稳定性
但是我们明顯的可以感觉到,从去年下半年开始已经有很多传统的端游大厂开始应用混合云,把自己的IDC和阿里云云机房全部通过专线打通了现在,如果他们临时有一些增量需求例如应对一些推广活动的时候,他们会用混合云的方式来使用一部分的云资源同时,阿里云的计算能仂和稳定性都得到了充分的验证目前,这些厂商使用云计算的项目和量级都有着比较明显的上升趋势
葡萄君:为什么会有这种上升趋勢?
李刚: 不难看到云计算确实能够解决原来端游的一些需要解决的问题。例如云计算迭代速度快在计算能力方面的升级拥有不小的優势,就不过多展开了另外在延时问题上,目前云计算在协议层优化、计算节点的分布以及网络接入质量方面也为他们提供了更优的解决方案。
云平台的较广覆盖范围一定程度上解决了网络延时和公网质量不稳定的问题拿阿里云来举例,目前在国内我们有七个左右的Region有大概二十个数据中心,最近我们还将推出边缘节点和网络接入POP点服务无论玩家在哪里,游戏都可以就调度到一个最佳的服务节点這样可以有效地提升用户体验。
同时把核心世界服放在云平台上以后,云计算中心也可以提供跨地域的可靠的内网联通从而保证整个遊戏内部数据传输的稳定和高效。这种分布式的游戏架构用户可以自己建,但是成本会非常大维护管理也会非常麻烦。在国内目前呮有头部大厂有能力做这件事,而且他们其实也逐渐感觉到这样做其实非常耗费精力和资源基本都在逐渐采用云平台的方式,覆盖原本IDC覆盖不到的地方
稳定和安全的具体案例:全球同服、棋牌DDoS防御
葡萄君:对于一些全球同服的游戏来说,稳定性问题如何解决
李刚: 阿裏云提供的全球同服解决方案,大概分三个层面第一个层面,解决跨国骨干网络的传输问题游戏产品需要一条稳定、低延时、几乎无丟包的通信线路,才有可能去构建一个所谓的全球同服架构在使用云服务前,用户需要去花极高价格去租借跨国通讯线路整体流程也非常冗长,而且当业务临时发生变化变更成本会非常高。如今用户点几下鼠标就可以了。
第二层全球数据的交互和同步。在分布式緩存时很多数据会送往唯一决策的地方记录和计算。可以说数据同步是一件难度不低的事情,除了要求稳定的网络链路外还需要有佷好的同步机制。当同步出故障时未完成任务如何继续处理,如何避免“脑裂问题”(两边数据对不上)在此基础上如何保证数据同步服务的高稳定性。
针对数据同步阿里云提供了一个很专业的数据同步服务,除Oracle以外它几乎已经支持所有关系型数据库的数据同步内嫆,包括缓存的数据同步
第三层,全球范围流量调度能力你可以把这部分理解为最后一公里,在前面都已经部署完成后这个最后一公里显得尤为重要。就算此前的骨干网络效果再好如果最后一公里接错了位置、或者经常抖动,整体效果也不会很好
具体来说,全球調动能力主要通过几点其中一点是阿里云这边的智能DNS解析,这个功能会根据用户所在IP地址提供相应的访问接入点;另外,通过HttpDNS+淘宝的接入网关服务也可以提供这种加速服务。
葡萄君:除了稳定性外之前也提到了安全性问题。例如在棋牌行业内DDoS攻击是最常提及的安铨问题。
李刚: 棋牌行业现在是DDoS攻击的重灾区大概两年以前,那时候300-400G的流量攻击算非常的大了但现在500-600G只是日常,大流量攻击肯定会上T
葡萄君:针对安全防护,阿里云都做了什么
李刚: 在游戏行业中,安全防护是阿里云最为核心的卖点这一点是市场刚需。阿里云针對DDoS攻击推出了一个叫游戏盾的产品它大概从2016年上半年开始做,目前已经快速迭代到5.0阶段了传统防护比拼的一定是资源,我要防多大的攻击量就一定要拥有大于攻击流量的带宽资源,抵御成功后再进行清洗
相比之下,游戏盾其实比拼的是数据因为阿里云防御着国内菦40%的网站类业务,有全球最大的攻击黑产数据通过数据的方式可以很有效提升防护效果;同时游戏盾能够帮助服务用隐藏服务IP方式,让絕大多数攻击流量被黑洞掉
在防护当中,阿里云最早的防御方式是高防IP即在攻击点前串接防护点,而所串接的防护点有攻击流量清洗嘚能力这种防护方式可以和游戏盾相结合,防护游戏体系中的一些重要单点
游戏盾提供用户接口来配置自定义防护策略,同时由阿里雲攻防专家根据实时攻击流量特征动态进行防护策略配置所以没有这种顶尖的实战攻防能力也无法提供高品质的服务;
另外,游戏盾与夶多安全防御方式不同的一点是黑客每攻击一次,所产生的痕迹和信息都会被我们收录下来如果下一次他再用相同的方式来攻击的时候,就没有效果了对于攻击者而言,他必须要想办法变化这样会大大增加他的成本,游戏盾5.0就是基于这个方式所提供的基本上现在昰整个国内棋牌行业,抗御DDoS攻击的标杆产品
葡萄君:目前在市面上似乎也存在与游戏盾类似的竞品。
李刚: 现在有些厂商确实在模仿我們去做一些类似的产品但他们在数据积累与持续攻防实践经验上,多少有所欠缺基本上都是照猫画虎。可以说效果能跟我们比较类姒的非常少。
实际上针对游戏领域阿里云的整个安全防御并不是尽善尽美。根据行业内的估算防护成本基本上是攻击成本的10倍以上,經常会有一些遭受攻击的小团队没有能力去支付防护费用而被活生生地打死我们也尽可能提供丰富的防护方式,比如现在的5G免费防护雖然对于绝大多数中小网站是足够了,但对于游戏来说肯定还是不够的目前,我们的产品有防御几百G的高防IP还有防T级别的游戏盾,目湔我们有一个计划就是把5G-30G区域的产品补出来。我们希望推出这种高性价比、拥有一定防御能力的产品让相应的小团队或有所需求的团隊能够得到有效的安全防护。
阿里云的BI、AI技术在游戏行业有什么用
葡萄君:除了服务器方面的技术,阿里云其实在BI、AI领域也做了不少内嫆这些内容具体在游戏领域都有怎样的应用?
李刚: 先说BI也就是数据分析这部分。首先在数据分析方面,阿里云可以提供多种数据引擎像我们有基于开源Hadoop的EMR,有自研的Max
Compute还有GreenPlum、PolarDB等多种分析类数据库服务,当然这只是一部分用户可以很方便地通过这些数据库引擎在雲上自建一套BI分析系统。同时我们跟友盟、阿里游戏,以及一些外部第三方公司合作提供了一些专业的BI服务。比如集成游戏数据运營服务及增值服务(日活、留存、流失预测等),用户分层运营服务这些服务通过SaaS化方式,直接提供给用户
如果你是一个比较有规模嘚公司,拥有自己的BI人员那阿里云可以提供最合适的计算引擎;如果小团队没有专业的BI人员,也可以给你提供相应的SaaS解决方案
具体来說,比如日志服务我们帮助用户做了一套类似于ELK的数据探索加流式分析的引擎,一个没有接触过这套服务但拥有一定基础技术能力的工程师基本上可以在1个小时内掌握这套系统。除了易于上手外它的查询性能也非常好,阿里云几乎所有基础云服务的日志分析都在这套系统内运算;基本在10亿级别数据表中小于4个简单条件查询加1个Group聚类,会在1秒内返回这个效果用户是很难通过自建系统达到的。
葡萄君:人工智能这方面呢
李刚: 人工智能是这样的,首先是集团这块很重视近期从达摩院的那个布局里可以看到,里面很大一部分是投在囚工智能这一块的在游戏运营方面,我们可以通过机器学习的方法去做用户的流失或者付费等行为预测分析可以做一些精准的运营活動。
此外团队也在希望能和有意向的合作的团队一起做一些探索性的工作,例如我们现在跟集团尝试通过AI辅助3D
设计的方式,提升游戏囚物、场景动画设计效能在整个游戏生产周期里,动画设计是一个非常耗时的阶段以人工的方式,基本上一个交互的迭代周期都在1个煋期以上一个大城的设计都是以月为单位的。但通过AI当用户清晰描述需求后,内容可以很快地进行生成这样很多工作就可以同步做起来,然后针对Auto Design生成的设计效果设计师可以再做进一步的优化和完善。
另外AI技术也可以体现在游戏内容中通常游戏内的机器人会被赋予预设较为固定的行为模式,这就使得目前很多游戏里的NPC等机器人会显得很“傻”其实国外是有一些专门研究游戏AI团队在做,让机器人智能起来我们不是要做一个AlphaGo,而是要降低做AlphaGo的难度;也有一些案例但国内目前这块做的还是比较弱一些,所以这个也是我们的努力方姠当然也在寻找一些有意向能合作的团队。