“每个人都期望机器学模型能做出有价值的决策……人工智能和机器学习是我们从数据中提取最大价值的地方……如果你看看一项技术的原始潜力,以及我们从游戏领域提取最大价值的地方,那就是人工智能和机器学习
Farah Ali
增长技术副总裁 / Electronic Arts
Farah Ali 是 Electronic Arts 技术增长战略副总裁,负责为全球 5 亿用户创造世界一流的沉浸式玩家体验。在加入 EA 之前,Farah 是 FreightWeb 的联合创始人兼首席技术官,FreightWeb 是一家风险投资支持的物流公司。除了目前在 EA 的职位外,她还是非营利组织 One Good Act 的创始人兼总裁,以及 PWIC 的联合创始人,旨在帮助倡导 STEM 领域中代表性不足的人群。
在本期节目中,Farah 解释了她的团队如何使用 PB 级的数据来构建更具竞争力的游戏体验。她分享了如何使用数据来大规模地推动个性化、提高游戏质量、创造新的世界以及培养现实主义。她还分享了如何利用数据来确保更好的性能和可靠性、打击欺诈,并为游戏玩家培养公平、包容的环境的见解。
MICHAEL KRIGSMAN:今天,我们与 Electronic Arts 的技术增长战略副总裁 Farah Ali 讨论大规模实时数据。 在我们继续之前,我要非常感谢 Redis 使这次对话成为可能。 非常感谢 Redis。 Farah,你好吗? 很高兴今天见到你。
FARAH ALI:我也是,Michael。 我很好。
MICHAEL KRIGSMAN:Farah,给我们介绍一下 Electronic Arts。 这是一个品牌名称。 我们都知道 Electronic Arts 这个名字,但请给我们一些内部视角。
FARAH ALI:好吧,我们在 EA 的使命是激励世界玩游戏。 这有点像公司的目标。 我们真正专注于构建最好的游戏、数字内容和服务,以使客户体验、玩家体验令人愉快。 我们确实将游戏视为建立联系、建立意义和保持好奇心的一种方式。 无论你的年龄,无论你的人口统计数据。 所以这真的是关于有趣、娱乐、连接的体验。
MICHAEL KRIGSMAN:我喜欢这个。 我很高兴讨论数据,以及数据如何支持你刚才描述的这个使命。 那么 Farah,你的角色是什么? 我知道你是技术增长战略副总裁,但这翻译成什么? 你在 Electronic Arts 做哪些活动和事情?
FARAH ALI:所以,这是一个非常有趣的角色。 它是技术战略、公司战略和公司开发角色的混合体。 我主要做的是研究新兴和未来的技术,以及这与我们的技术战略有何关系。 因此,可以将其视为为我们的技术战略创造未来的契合点。 作为其中的一部分,我正在进行一些特殊项目、孵化项目。 我研究技术并购。 我们应该投资某些技术吗? 我们应该购买某些技术吗?
这实际上只是关于,我们如何确保我们保持竞争力? 对于你听到的每一个新趋势、想法或技术,我们都会有人评估它的优点。 评估它,但结合我们作为一家公司所做的事情,我们的目标是什么。 因此,技术不是最终目的,而是真正关于如何使用它来进一步愉悦我们的玩家并增强玩家体验?
MICHAEL KRIGSMAN:所以你将技术视为支持或实现你之前描述的伟大的玩家体验和沉浸式体验的工具。
FARAH ALI:完全正确,完全正确。 以及我们如何确保我们具有竞争力,对吧? 我们没有落后。 当我们考虑像区块链技术这样的东西时,它在哪里相关? 当 VR/AR 首次出现时,该领域一直存在不断的实验。 但在我们真正看到机会、杀手级体验、收入增长机会之前,我们不会大规模扩展。
MICHAEL KRIGSMAN:所以这一切都非常具有战略意义地支持你的客户。
FARAH ALI:完全正确。 这在很大程度上是为了支持我们的客户,我们的玩家。 如果这对我们的玩家没有意义,如果它没有以某种方式增强玩家体验,如果它没有以某种方式增加游戏体验,那么我们就不会纯粹从技术方面来看待它。
MICHAEL KRIGSMAN:我知道你非常注重数据。 你使用大量的实时数据。 你能描述一下这些数据如何融入你刚刚为我们概述的整体战略蓝图中吗?
FARAH ALI:是的,我的意思是我们每天都会收到来自用户的 PB 级数据。 这些数据来自正在玩的游戏、正在运行的服务、正在投放的内容以及我们正在运行的活动。 所以这是各种各样的数据。 我们会考虑将其用于许多不同的用例。
我想说,特别是当您考虑如何使用我们的数据时,有四种不同的人员角色。 因此有业务领导者。 他们大多不需要实时数据。 他们实际上正在研究一些关键客户指标是什么? 他们正在寻找趋势。 他们确保事情朝着正确的方向发展。 每个玩家的平均花费是否在正确的位置? 客户平均在什么时间与游戏进行互动? 玩家的情绪是什么?
因此,有时每日波动只是一种噪音。 它并没有真正指向一个方向。 因此,这实际上是一种随时间推移的趋势。 但是,在某些情况下,它是一个隐私或合规问题,或者存在一个地理敏感问题。 因此,这种数据也具有实时性,高管可以实时做出反应。 因此,这种数据适用于业务领导者、执行决策和战略。
然后,是制作人或游戏开发人员。 他们真正专注于玩家体验。 制作人、游戏设计师正在查看数据并说,我以这种方式放置了这个游戏地图。 我在这里有一栋建筑物。 我有一些你可以与之互动的内容。 玩家实际上是在以我期望的方式与游戏互动吗?
因此,这是一个不断循环的试玩、获取数据、回到绘图板并进行迭代的过程。 因此,我们正在构建最好的游戏。 我们正在按照实际使用的方式构建体验,而不是我们认为应该的方式。 因此,存在大量的实时遥测数据,但这不仅仅适用于实时游戏。 它也适用于目前正在制作中的游戏。
然后,你有分析师。 分析师正在研究,你如何从数据中获得见解? 因此,你有指标,你有定量数据,你有一些定性数据。 你如何将它们组合在一起,从而真正理解它? 并且可以证明或反驳实验。 或者你可以测试的假设。 或者只是查看预测和趋势。 分析师通常与业务领导者或制作人、游戏开发人员配对,以实际帮助他们挖掘这些数据。
然后你有你的工程师。 你可以有数据科学家。 你有数据分析师。 因此,你有数据工程师,然后你有实际构建系统的常规软件工程师。 因此,他们正在弄清楚,你如何构建正确的标准化遥测技术? 这些数据将在哪里收集和存储? 如果它是实时的,我们的系统的可扩展性如何,允许数据进入?
从本质上讲,使得系统允许每个需要访问该数据的人轻松访问。 然后,上面的工作流程是自助服务。 例如,游戏开发人员将大部分时间用于专注于游戏和开发游戏。 他们不必担心遥测、构建系统或捕获数据。 因此,这些都可以由这些工程师大规模完成。 这主要是我们考虑数据的四种方式。
MICHAEL KRIGSMAN:听起来数据已经非常紧密地融入到公司的结构中,融入到 DNA 中。
FARAH ALI: 是的,的确如此。我刚才提到的一些角色,你可以思考一下它们的应用场景。例如,游戏制作人、游戏开发者,他们真的在考虑大规模的个性化。所以当你在玩游戏时,你应该感觉它是为你量身定做的。其中的乐趣在于,难度既不会太高,也不会太低。所以这里面有一个动态难度的概念,这对不同的人来说是不同的。
如果你在玩一个与其他玩家在线的游戏,这是一个多人游戏,我们如何将你与合适的技能水平相匹配?既不会太高,也不会太低。所以有很多方法可以思考如何使用这些数据。我们考虑大规模的个性化以及为此所需的数据。我们考虑——我们称之为智能质量应用。它可以应用于任何地方,从发现游戏中的漏洞,到实时网站问题,再到欺诈检测、作弊。
还有像程序化生成这样的东西。你如何使用数据来真正创造史诗般的世界?创造角色?创造面孔?所以你不是手动创建东西。你实际上是在使用数据并从中学习。然后通过算法创建世界、游戏和角色等等。
还有游戏中逼真的人物。你有非玩家角色。在 FIFA 中,你会看到球员在上面奔跑的草地。它会像你期望的真草一样在风中摆动。所以我们关注那些微小的细节。这些微小的细节让你的体验更加身临其境,更加真实。所以是的,这些是我们思考数据的不同方式。
MICHAEL KRIGSMAN: 你刚才说了一些非常有趣的事情。使用数据来创造世界。最近 Facebook 一直在讨论元宇宙。你能让我们稍微了解一下你们如何使用数据来创造世界吗?这是一个非常引人入胜的说法。
FARAH ALI: 我认为这与元宇宙的想法略有不同。如果你不得不今天构建一个游戏。假设你想看看你真正兴奋的科幻小说,你想把它改编成一个游戏。想想角色数量之多。想想你必须实际绘制的世界。然后是你必须创建的动画场景。这需要大量的手动工作。以及由此导致的产品上市时间。
所以这——部分原因是为了提高效率。所以我们不需要真正去拍摄和动作捕捉 100 个不同的人,只是为了在 FIFA、Madden 或其他这些体育游戏中创建观众。但如果我们有足够的数据,我们实际上可以去创建人群。所以他们不是真人,而是通过算法生成的。所以一部分是为了提高效率,一部分是为了实现真实感。你在电影中看到过这一点,你在计算机生成的内容中看到过这一点。
在元宇宙方面,我们考虑的是沉浸感。所以,我们真正思考的是你与游戏的互动如何让你感觉就像你在游戏中一样,甚至无需考虑 AR、VR 或这些技术。而实现这一目标的方法之一是使游戏体验非常非常流畅。当你在角色中时,你感觉自己就是这个角色。你是故事叙述的一部分。这实际上是关于讲故事。这实际上是关于游戏机制。这实际上是关于游戏心理学。
元宇宙本身是一个引人入胜的话题,我认为围绕它有很多讨论。我认为,对我来说,最核心的是身份。所以你如何在每个在线平台上拥有相同的在线身份?所以如果我有一个特定的身份,我希望同样的身份与 YouTube、Twitter、我的 EA 账户相关联,或者当我访问 Facebook、或者当我玩一款史诗游戏时。以及组织之间如何实现这种互操作性。
我认为,对我来说,这些是一些挑战,互操作性和核心身份。因为你如何做到这一点,同时仍然保持去中心化的环境?我认为最后关于元宇宙,关于数据的最后一点是,谁对数据负责?所以人们会创建很多内容。谁负责管理这些内容?
谁负责查看——我们查看数据是为了对游戏玩家进行个性化设置。这是因为我们有一个使命,并且我们对游戏玩家负有责任。而元宇宙实际上不属于任何人或不受任何人控制。它是由集体社区来决定这些体验应该是什么样子,是否应该进行个性化设置。所以我非常好奇它将如何发展,以及围绕它的治理将如何发展,以及审核将如何发展。
MICHAEL KRIGSMAN: 很多非常有趣且非常开放的问题,我怀疑这些问题在未来几年内都不会得到解决。[笑声] 当你收集关于游戏玩法的数据时,游戏的工具化程度很高吗?你是如何获取这些数据的,并且当玩家在游戏中移动时,你如何处理这些数据?
FARAH ALI: 所以我们确实有一个标准化的遥测系统。这非常重要,因为这样游戏团队实际上可以决定他们想要查看的指标类型,他们想要进行的分析类型。以及为此,他们应该启用什么样的工具。所以当你进行工具化时,例如,像这个游戏是 x 模式这样简单的东西,而 x 代表着某种含义。
你实际上可以用一种非常标准的方式在游戏中对它进行工具化。这意味着当你在实际转换——实际消化或摄取数据并转换数据时,它会以你期望的方式出现。这意味着你可以拥有标准化的仪表板、标准化的报告。因此,遥测和工具标准化是我们处理和管理数据的一个非常重要的原则。
另一个方面是如何——例如,当你玩游戏时。假设它正在生产中,它是实时网站。最重要的事情之一是性能、可靠性和正常运行时间。如果你正在玩一个游戏,你实际上将要获胜,然后,砰的一声,你断开了连接。并且你在一分钟内无法重新连接。游戏结束了。你失去了那个历史。那个数据消失了。例如,你在那场比赛中赢得的任何金币可能都会消失。所以你如何确保这种情况不会发生?
你不可能一直避免停机。但是你如何拥有可靠性,从而拥有始终如一的体验。所以我们真正考虑的是查看异常检测。我们有围绕它的工具。一个例子是,我们查看任何给定时间的峰值同时在线用户数。我们将绘制曲线来查看这是实际的 PSU,这是预测的 PSU。
然后我们将测量实际值和预测值之间的差异。如果差异大于我们期望的,那么我们会将其标记为异常。然后那个异常,通常我们会有更多的数据会指向,哦,这是数据中心的停机。或者这是信道中的光纤被切断。或者这个 ISP 正在以这种方式交互。或者我们实际上在服务器端遇到了崩溃。
然后其中一些实际上是自动修复的。例如,可能游戏中存在一个 bug。并且之后,游戏服务器运行了 x 小时。并且内存,它只是不断累积。并且它耗尽了内存。因此,当检测到该特定异常时,可能会直接重新启动该机器。但是,它也可能会在事件管理流程中打开一个票证,该票证可能会说,在此特定代码中发现了此内存不足异常。这需要修复并放入我们的下一个补丁中。
因此,有很多自动处理的方法。也有手动处理的方法。另一个例子是当我们进行匹配时。因此,如果有人在线,并试图与其他玩家进行匹配。并且他们没有被匹配。并且已经超过了某个分钟数甚至秒数,那么会触发一些事情。然后我们会提供,你在这里与机器对战。这是一个你可以一起玩的 NPC 角色,因为可能没有那么多人在线,或者我们无法连接到那个地理位置。所以那是另一种方式。
最后一个例子是关于安全或欺诈。所以我们有方法来检测游戏中是否有人是不良行为者。例如,我们知道玩家使用的所有 Xbox 设备。我们只是知道哪些设备有一个被禁止的帐户,或多个被禁止的帐户,或没有被禁止的帐户,以及它们是如何相互连接的。
然后,我们根据此信息为玩家分配风险评分。然后根据我们检测到的入侵类型,可能会导致某种临时黑名单。可能会导致暂时停权。可能会导致某种其他机制,其中与玩家进行某种沟通。或者,如果真的非常恶劣,那么会彻底禁止该玩家,这种情况很少发生,并且可以提出异议。
所以这些事情都有可能发生。当你有一个有很多人参与的实时在线游戏时,你有责任确保该体验是安全的,该体验是可靠的,并且它是公平的。生态系统中的每个人都有公平的获胜或失败的机会。因此,当我们实际考虑实时网站和数据时,我们会考虑很多这些因素。
MICHAEL KRIGSMAN: 正如你之前所说,听起来你正在处理大量的实时数据、非实时数据、定量数据、定性数据,所有这些数据混合在一起并同时流动。
FARAH ALI: 正确。是的。是的,我的意思是每天生成 PB 级的数据。我们全球拥有大约 5 亿玩家,以及 300 多款游戏。所以你可以想象我们获得的数据类型。而且 EA 自 82 年以来就一直存在,所以我们也有大量的历史数据。当我们查看我们游戏的较新版本时,我们也会使用这些数据。
我想说,一些实时用例,就像我说的那样,是围绕安全合规、实时网站、正常运行时间、性能、可靠性。它也适用于诸如,我们的规模合适吗?我们是否有太多的服务器启动,但玩家太少?所以我们需要实际缩减规模,并确保我们具有成本效益吗?
然后是第二部分,即非实时。这部分你可能不需要像一些实时网站报告指标那样高的粒度。所以如果你想查看预测、预算或一段时间内的情绪,或者游戏中一段时间内的平均会话时长。或者像我说的那样,游戏中一段时间内每个玩家的平均消费。你希望在历史数据中查看它。你希望能够以多种方式对其进行切片和分析。
因此,非实时数据的重要之处在于数据的分类。我可以看到特定区域中最常见的客户支持问题是什么吗?我可以按特许经营权进行操作吗?我可以按频道 ID 进行操作吗?我可以按客户服务代表进行操作吗?我可以按已打开和已关闭的事件数进行操作吗?以及你将来如何处理这些数据,是数据收集方式的一部分。
而且我认为最后一块拼图是实时和非实时数据的结合。 我刚才提到的业务案例是,领导者需要查看趋势,但同时也真正需要了解现在是否发生了非常严重的事件。 以及你如何应对? 有时,你需要真正采取行动,作为一名高管,就世界局势发表声明。 你会看到围绕这些事件发生的各种情况。
因此,这也关系到我们的员工,关系到我们的环境,关系到我们所生活的世界。 所以我们不仅仅是为了构建游戏并从中获利,我们还存在于一个生态系统中。 我们如何与这个生态系统互动也是其中很重要的一部分。
迈克尔·克里格斯曼:法拉,你收集了如此多不同类型的数据。 对于许多企业来说,当他们收集到这些数据时,很难确定重点在哪里。 那么你如何确定优先顺序,应该关注哪些数据,以及应该放弃哪些数据等等?
法拉·阿里:这是一个很好的问题。而且,你知道,我认为我们也没有做到完美。我认为很多人和很多公司犯的错误是没有问自己,你想得到什么问题的答案?你想运行什么实验?以及你希望如何评估它们?
所以如果我想查看一段时间内的趋势,那么我是否每五分钟或每十五分钟收集一次数据并不重要。 小时粒度可能就足够了。 两小时或每日粒度可能就足够了。 所以不问自己这些问题也意味着你过度设计,或者最终构建的堆栈最终会花费很多钱。
我认为第二点是,有时这些东西无法很好地水平扩展。 因此,你正在创建定制系统,并且你被绑定到内部部署的托管解决方案。 所以我认为这实际上是关于提出正确的问题,并真正回到角色本身。 你有你的商业领袖或高管角色。 你有你的工程师角色。 在我们的例子中,你有你的制作人、游戏设计师角色。 在其他一些情况下,它将是医学专家角色,以及他们需要哪种类型的数据,例如。 然后你有分析师。
并非所有这些人都需要实时数据。 其中一些人没有技术背景,他们不需要了解数据的组织方式或其背后的数据结构。 你只需要有一种自助服务的方式来访问它,立即访问它,并能够处理它。
所以这实际上是在你的存储管道和你的查询处理管道之上构建这些工作流程,允许每个人即插即用。 在这种情况下,你可能有一个轮辐式模型,分析师甚至可以创建自己的机器学习模型,或者他们可以插入即插即用组件。 所以他们可以做他们需要的处理。
但这实际上是关于预先提出正确的问题,了解有多少百分比的数据需要是实时的,多少百分比不需要是实时的,然后在你实际设计系统时将其考虑在内。 然后使其具有可扩展性。 所以构建一个即插即用或模块化组件,这样你就可以随着时间的推移针对你现在无法预见的新用例进行扩展。
迈克尔·克里格斯曼:你对这些角色以及每个角色需要完成的数据类型和分析类型都有很清晰的认识。 我可以想象,这种清晰度部分来自于你作为一个组织的悠久历史。 正如你所说,你作为一家公司已经存在了几十年。
法拉·阿里:是的。 部分原因是,我的个人清晰度来自于我长期以来一直是一名运营人员。 我最初是一名个人贡献者,一名工程师。 我曾经是人事经理。 我管理过大型工程团队。 所以我亲身处理过这些痛点。
我处理过没有良好理解的遥测系统或仪器系统的情况。 所以不得不构建这些定制系统,然后每次都不得不构建一个翻译层。 当你需要时无法获得实时数据。 当发生某些事情时,无法在实时端进行调试和故障排除。 所以部分原因是,我实际上是从过去的经验、过去的错误和失败中吸取了教训。
然后第二点是,是的,当你实际拥有历史数据时。 当你看到特许经营权做得好还是不好时。 然后当你拥有如此多的情感数据时。 游戏玩家最棒的一点是,他们是一个非常爱说话的群体。 你不会遇到从这个客户群那里获得反馈的问题。 他们在 Twitter 上。 他们在 Reddit 上。 他们在给我们打电话。 他们在使用聊天。 他们在使用电子邮件。 我们挖掘所有这些信息。
所以我们可以实际去查看情绪,然后我们围绕这些情绪创建主题。 所以我们对我们在哪里看到问题以及我们可以在哪里解决问题有很好的了解。 并且这里的数据实际上是我们没有考虑过的事情,这些数据是否会回到我们的游戏制作中? 我们是否应该使用它来实际构建我们的下一个实时内容投放? 人们是否要求更多某种类型的武器? 还是更多某种类型的面具或皮肤? 我们是否应该去做?
例如,随着时间的推移,你已经了解到人们喜欢在游戏中看到自己,尤其是模拟人生,它是一个模拟游戏。 所以我们收到了很多关于万圣节的反馈,以及关于我们庆祝的所有这些事情的反馈。 所以我们已经把这些反馈考虑进去了。
我们实际上有一个非常酷的部门。 我相信它被称为“积极游戏”。它只关注我们如何使我们的游戏对玩家更具包容性。 所以他们以完全不同的方式看待数据。 因为他们是从我们对玩家的社会责任是什么的角度来看待它的。 我们如何确保每个玩家都觉得自己和我们一起在游戏中。 是的。 所以,我认为,随着时间的推移,站在工程师和分析师的立场上,但也站在玩家的立场上。 真正像玩家一样思考。 我认为这有助于我们获得这种清晰度。
迈克尔·克里格斯曼:所以你把这两方面结合在一起。 我再次使用“清晰度”这个词。 将幕后花絮与玩家的视角结合起来,它们相互叠加。 所以你正在处理如此多的数据,而且它来得如此之快。 你有什么样的基础设施来管理这种爆炸式增长的数据量?
法拉·阿里:是的。 我认为这个难题的另一部分是你并不总是知道你需要它做什么。 比如,我们不知道元宇宙需要什么,或者其他未来的用例需要什么。 所以在任何类型的基础设施层面,你都必须考虑存储。 然后你必须考虑是否——你需要立即访问该存储吗? 或者它是冷存储? 所以你如何决定立即需要与长期存档?
所以我们有存储部分,然后你有摄取层。 那么你如何实际摄取来自你的游戏的所有数据,以及来自社交渠道的所有数据? 所以来自 Twitter、Metacritic 等等。 来自你的财务系统,来自你的会计系统,来自许多其他来源。 所以你需要一个可以实际摄取和聚合这些数据的地方。
然后在此之上,你需要一种访问这些数据的方式。 所以你需要构建自助服务的 API。 你需要构建自助服务的工具。 你需要构建任何人都可以去创建他们需要提取的工作流程。 例如,可能存在数据分析师使用的 ETL 工作流程。 分析师可能会使用实验管道。
所以你实际上可能会在你的整个工作流程之上构建一个 AI 和实验管道。 这实际上就是我们所拥有的。 这是你的数据训练、测试、预测/评估管道。 所以你实际上可以去构建用于异常检测的模型,用于欺诈检测的模型,所有这些不同类型的案例。
所以你有你的基础设施。 你有你的堆栈。 然后你有你的团队需要用它做一些事情,他们正在构建他们特定的应用程序部分。 将其视为插件提供商模型,他们编写自己的插件。 也许是为了他们的事物、应用程序或服务的部分。 但我们提供——核心数据团队提供存储、摄取、访问和核心 AI 以及实验平台中的关键工作流程的基础设施。
迈克尔·克里格斯曼:你所描述的这种基础设施,有多少是基于云的? 有多少是内部部署的? 你如何决定是将基础设施的各个部分放在云中还是内部部署?
法拉·阿里:是的,这是一个很好的问题。 所以我们实际上采取了一项深思熟虑的战略,在过去几年里转向云计算。 我会说我们的大部分工作负载都在云端。 我认为另一个原因是,游戏用例变得如此重要,以至于云提供商也开始构建合适的 SKU。 所以最初我们需要 GPU,而这并不是我们能从其中一些提供商那里获得的。 现在,这很常见。
所以我们的大部分工作负载都是基于云的,它为我们提供了规模优势。 它为我们提供了区域覆盖、地域分布的优势。 然后它便于所有数据管道、我们的开发人员和分析师访问。
当我考虑内部部署时,我们过去在处理 BII 数据时使用它。 或者出于某些安全原因。 或者某些合规性原因。 或者如果有一个非常定制的游戏服务器,一个非常定制的,只有我们才能在内部部署中运行的游戏服务。 所以这可以说是例外情况。 我们的目标也是,一旦我们看到有商品化的产品在云端,我们就想将其迁移到那里。 其主要原因是规模和效率。 它确实有助于我们更好地计划。
因此,我们在游戏中做的一件事是,在进行生产时,并且在基础设施方面开发游戏时,我们会不断测试游戏服务器密度。 所以我们正在查看每个游戏服务器有多少玩家,以及我们如何调整大小。 因此,我们实际上可以去说,好吧,我们可以通过调整到这个特定的密度来节省数百万美元。
然后我们会进行大量的性能和规模测试。我们会查看过去的数据,比如,对于去年推出的同类型游戏,第一天、第二天、第三天的峰值用户分别是多少。我们会回顾尽可能多年的数据,然后用这些数据,结合预售情况,来预测未来的峰值用户,并在实际测试时进行 2 倍、3 倍、5 倍的压力测试。我们会从合理的规模开始,但我们的后端已经配置好,可以随时启动服务器。
你可以在本地部署服务器,但这非常困难。你必须购买机器,而且已经为此付了钱,如果用户数量不如预期怎么办?最终你会浪费很多钱。这就是我们的考虑方式。而且我们不依赖任何特定的云服务提供商。我们努力采用混合策略,以便利用所有提供商的优势。
MICHAEL KRIGSMAN:延迟以及访问、传输和通信数据的速度,是否会在您选择云还是本地部署时发挥作用?
FARAH ALI:当然,绝对的。云服务提供商的伟大之处在于,在过去 10 年左右的时间里,几乎每个地区都有他们的存在。我认为,最初的挑战之一是,如果我们在中东地区没有... 我们有很多在中东地区的玩家,但我们附近没有数据中心。所以我们不得不... 例如,对于我们的体育游戏,我们在那里有一些非常重要的玩家。我们希望确保他们获得足够的带宽。
但现在,我们可以将这些工作负载迁移到云端。所以,在大多数情况下,这不是问题。对于某些地区来说,这仍然可能是一个问题。但这通常是因为当地的费用以及他们自己地区的带宽限制。在这种情况下,我们有时需要做一些专门的处理。但在大多数情况下,我认为云已经为我们解决了这个问题。拥有区域数据中心确实为我们解决了这个问题。
我们所做的是... 我们构建游戏的方式是模块化和组件化的。你可以将游戏部署到任何特定的容器中。一旦你将游戏容器化,就可以很容易地将其部署到任何地方。这是我们做出的转变。否则,以前,游戏会被打包成只能在定制的本地机器上运行的方式。
所以我认为我们仍然会遇到一些性能问题。我们会遇到“橡皮筋效应”(指玩家连接不稳定时,角色会突然跳跃的情况)。有时,这是因为在线流量太大。我认为去年我们确实经受了考验。每个人都在线,而且不一定是玩游戏。这让我们能够更好地预测并处理额外的工作负载。
MICHAEL KRIGSMAN:听起来云服务提供商变得越来越好,并且不断改进,这让你的工作变得更容易。它给了你过去没有的极大的灵活性。
FARAH ALI:绝对是,因为我们需要始终在线。我们必须这样做。有了订阅模式和生命周期服务模式,我们必须始终在线。原始计算能力,以及获得比以往更多的原始计算能力。以及我们可以根据需要进行水平扩展,这确实帮助我们缩短了上市时间,并实现了规模化。
我认为真正对我们有帮助的是,许多云服务提供商都是很好的合作伙伴。当我们看到一个不存在的用例时,我们可以向他们解释。这也能帮助社区,因为其他人也可以从这个特定的 SKU 中受益。
所以,我认为如果这种情况没有发生... 如果你只能使用一个提供商,并且市场上存在某种竞争,那将非常困难。事实上,提供商必须提供比彼此更好的服务才能让我们使用,这对我们公司来说更好,因为我们总是能获得更好的服务。我们总是能获得更好的客户服务,并且能接触到想要构建我们所需产品的架构师。
MICHAEL KRIGSMAN:Farah,你多次提到稳定性和性能的重要性。你如何平衡成本与弹性、可用性、稳定性和性能之间的关系?因为你看,如果你花足够的钱,你基本上可以拥有 100% 的正常运行时间。但你可能不再有业务了,因为你无法承担维护它的费用。那么你如何找到这种平衡?
FARAH ALI:是的,我的意思是,我给出的关于游戏身份验证的例子在一定程度上说明了这一点。因为我们正在预测我们认为的流量。因为我们正在测试。因为我们正在进行 2 倍和 3 倍的测试,所以我们对正确调整规模有了更好的了解。然后,我们正在构建我们的基础设施,以便我们可以水平扩展。
所以,当我们开始时,比如,你正在进行早期访问测试发布。我就在那里。我以为我会获得 500 万用户。实际上我得到了 2000 万。好吧,你知道这不会让我惊慌失措。我只是启动更多的服务器。你意识到,哦,我们得到 2000 万而不是 500 万的原因是营销部门也有一个活动,每个可乐瓶都会给人一个免费注册的机会。所以我们实际上预计流量会在两三天内回落到 100 万,因为那时促销活动就结束了。
因此,能够监控这一点,然后能够缩减规模,并且能够缩减规模,有助于我们维持现状。并且即用即付费的模式允许我们为我们实际使用的东西付费,这真的对我们有帮助。所以即使我们偏离了,这从 100 万到 2000 万也是一个很大的幅度,如果我们进行监控,我们仍然可以纠正。所以这里的关键是监控。这里的关键是,当你在监控时,当你有一个数据点时,真正知道它意味着什么。
有时营销部门会进行一次活动,但实际上并没有密切沟通。也许游戏团队不知道正在进行这次活动。因此,在弄清楚这一点上浪费了时间。所以这些事情实际上更重要。当你启动时,你需要了解围绕这次启动发生的一切。然后,你可以相应地进行计划。
但是,即使在测试环境和预生产环境中测试和启动云服务的能力,也让我们能够测试规模。这比生产环境更准确地说明了配置。不过度配置是实际上避免过度支出的关键。
MICHAEL KRIGSMAN:当然,你们拥有大量高度准确的历史数据,这使你们能够运营业务的这一方面,即预测和规划方面。
FARAH ALI:完全正确。我认为仅仅拥有历史数据,而且还进行过多次发布,我们在这些发布中使用过这些数据,但我们错了。我们已经调整和纠正了。所以我们实际上可以对我们的预测感到相当有信心。
我认为当我们有一个全新的 IP,或者我们正在瞄准一个全新的受众群体,或者我们正在尝试一些全新的东西时,情况就很困难。但我想这对每个人来说都很困难。这不是唯一的。但随后,有办法进行线下测试。有办法收集线下数据,我们通过早期试玩测试以及使用我们与之交谈以获取反馈的玩家群来进行这些测试。
MICHAEL KRIGSMAN:在实时数据方面,创新是什么样的?使用实时数据的未来在哪里?
FARAH ALI:我仍然认为 AI 和 ML 是我们在数据方面可以提取最大价值的地方。游戏社区中有很多关于 NFT、区块链和元宇宙的讨论。但我仍然认为,如果你看看一项技术的原始潜力,我们在游戏中可以提取最大价值的地方,我认为是人工智能和 ML。
我刚才在谈论程序生成。想想我们可以在那里提取的价值,然后想想能够真正完全理解生态系统中的每个玩家。然后想想能够构建可以学习的机器学习模型。以及能够通过渗透我们拥有的关于这个玩家的数据来学习的深度学习模型,关于他们的各种信息。然后想想这创造的价值创造。所以我们现在拥有所有这些,我们如何增加更多价值。我们已经将他们作为一名玩家。
我认为可以发生大量创新的第二个方面是了解 Z 世代。这些 19 岁到 30 岁的人将玩游戏。他们在寻找什么?他们对什么感兴趣?他们的在线行为是什么?他们可能会与我们的一些游戏互动,但不是其他游戏。为什么不呢?以及当他们与不同的游戏互动时。如果他们玩模拟人生,但不玩 FIFA,但他们在某个特定时期对 Madden 感兴趣。这是为什么?
那么我们能否真正查看数据来进行故事讲述。然后,使用这些故事讲述来真正帮助我们获得那些帮助我们做出业务决策的可操作的见解。我认为就是这样。当我想到业务领导者和高管时,他们擅长建立联系。他们不擅长机器擅长的事情,即查看大量数据并理解它。但是一旦你能够理解它,你就可以将其以合适的语境呈现给合适的人。然后,他们可以从中获得伟大的想法。
因此,它可以帮助他们做出更好的管理决策。它可以帮助他们进行故事讲述。它可以帮助他们更好地了解他们的玩家和客户,这是这里的关键。客户现在在做什么?Z 世代或新的受众群体在做什么?
然后,如果我们想进入这些新的业务领域,如果我们想进入这些新的市场,如果你想创建这个以前不存在的新 IP,我们如何了解谁在寻找它?他们希望从中得到什么?我们可以为他们从中提取什么价值?我认为这仍然是数据、AI 和 ML 可以发挥重要作用的地方。
MICHAEL KRIGSMAN:我觉得很有意思的是,很多公司都在努力收集数据,弄清楚需要哪种数据,并收集这些数据。 在您看来,您拥有如此庞大的高质量数据。 因此,挑战就变成了创造力,创新,我们可以用这些数据做什么? 现在我们有了它。 我们该怎么办?
FARAH ALI:是的,完全正确。 我认为您说的也很有道理,我们如何确保它不是噪音? 有时您会遇到非常善意的领导者,他们会说,是的,我们必须收集一切。 但实际上,如果您查看公司中的仪表板,它们是被使用率最低的实用工具。 人们不喜欢看图表。 他们不喜欢看仪表板。 他们希望在他们正在做的事情的背景下理解数据。 因此,我认为关键在于,我们如何在数据之上构建真正提供那些有趣的可操作的见解的东西? 然后,根据您的角色和职能,在此基础上采取行动,这就是您所做的。
但我认为减少噪音,减少这种必须收集一切的想法。 您可以收集一切,但您可能永远不会使用它。 因此,明智地收集数据。 明智地制定您的数据战略,并明智地规划您计划如何使用它。 这样,您就可以真正清楚地了解如何将其用于最适合未来的技术战略。
MICHAEL KRIGSMAN:好的。 Farah Ali,非常感谢您与我们分享您的经验和专业知识。 这是一次非常有趣的对话。
FARAH ALI:谢谢你,Michael。 谢谢邀请。 我真的很喜欢。
电子书
数字经济正在挑战银行家重新评估其业务模式。 了解在向实时金融服务转型时出现的四个常见挑战的解决方案。