让人工智慧开发游戏,人类玩家只有被狂虐的份

2020-08-05

让人工智慧开发游戏,人类玩家只有被狂虐的份

1 日藉着全球最大的游戏开发大会 GDC17 的机会,辉达(NVIDIA)宣布推出最新款游戏用显卡 GeForce GTX 1080 Ti。新显卡採用 16 奈米製程 Pascal 架构,具备 3,584 个 CUDA 核心以及高达 11GB 的显存,从书面参数上比上一代游戏/通用计算多用途显卡 Titan X 效能稍强一些,比自己的前辈产品 GTX 1080 也强了 35%。

但喧嚣之余,PingWest 品玩关注辉达在游戏开发方面更多主张和尝试。这家称自己「All about AI」的计算技术公司,正在快速改变游戏和 AI 的关係。

此 AI 非彼 AI。在过去,游戏 AI 可以指所有非玩家角色(NPC),比如剧情中的配角、Boss 和商人等,也可以再进一步,泛指所有游戏的非玩家内容,比如作战机制和商业系统等。它是由人设计的。

但辉达觉得,游戏工业即将进入新的 AI 时代──用 AI 来帮助设计和开发游戏,而且品质不逊于人工。

「简单来说,过去的 AI 就是规则和程式档,让 AI 照着设计行动,到后来有了决策树,更先进一些。」辉达应用深度学习研究部(Applied Deep Learning Research)副总裁布莱恩‧卡坦萨罗说,但他认为,随着深度学习技术突飞猛进式发展,AI 可以帮助开发者生成声音图像素材,甚至剧情、工作等机制性的内容。

过去两年,辉达已带来多项利用机器学习和神经网路的工具,以解决游戏开发者面临的棘手难题。举个例子,大型游戏的一大特点是画面精美,但这需要美术人员和视觉设计师巨大的精力创作。受制于人员和财力,中小型开发者往往在视觉品质上打折扣,更多人选择向量化,甚至更粗糙的视觉风格。

辉达进阶开发技术经理安德鲁‧艾德斯登展示一项名叫「2Shot」的技术,让开发者更轻鬆地从真实世界中撷取材质,应用到游戏中:只需分别开启和关闭闪光灯,用手机拍摄两张材质的照片,电脑将自动处理,几分钟后即可生成素材档案。让人工智慧开发游戏,人类玩家只有被狂虐的份

2Shot 降低了开发者最佳化材质的技术门槛,但它仍有很大的提升空间。辉达在去年又提出了「1Shot」技术,採用更强大的神经网路计算,只需一张照片就能生成素材,时间也降低到只要数秒。2Shot 的生成素材品质已经达到工业级,而 1Shot 的品质还有待提升,但已证明了机器学习和神经网路在游戏开发方面的应用前景。让人工智慧开发游戏,人类玩家只有被狂虐的份

布莱恩‧卡坦萨罗。

辉达还展示了另外两种技术,分别为 Texture Multiplier 和 Super-Resolution。

Texture Multiplier(材质複製器)类似视觉特效人员常用的「材质增生」(texture mutation)技术,最大的不同是採用经过大量训练的卷积神经网路(Convolutional Neural Network)为建构程式,生成的效果接近真实,达到肉眼难以分辨的水準。Texture Multiplier 将使美术人员可以快速製作美观的大片面积材质,不再给人一种「你这材质是複製贴上的吧!」之感……

而 Super-Resolution(超解析度)则听起来更科幻。记不记得电影《神鬼认证:杰森包恩》里的情节:CIA 特工在雅典宪法广场上搜寻杰森‧包恩,用模糊的定格画面「放大、增强!」(Zoom, enhance!),然后就获得一张特别清晰的照片,确定了目标?让人工智慧开发游戏,人类玩家只有被狂虐的份

其实过去根本没有这种高科技……至少在《神鬼认证:杰森包恩》拍摄期间还没有,直到最近才有类似的出来。前不久 Google Brain 团队达成将 8×8 画素解析度,极度粗糙和颗粒化的头像,还原成相对清晰、32×32 解析度的头像,辉达也在做类似的事情。

该公司研究者採用的具体训练方法(注意:和其他机构方法类似,可做参照),是先把大量高画质照片「缩小」(downscale)到非常低画质,仅保留有限的特徵,同时另外把这个降级过程中损失的特徵保存下来。让人工智慧开发游戏,人类玩家只有被狂虐的份

採用这种方式处理大量高画质图片后,研究者获得海量损失的特徵。他们将这些特徵整理成一个「特徵规律程式库」,就像辞典,意图在告诉神经网路:再去「放大」(upscale)图片的时候,按照这个辞典作业。当然,具体过程比口头叙述複杂得多,这个卷积神经网路模型需要数天的时间才能完成训练。

在之前的测试中,Google Brain 团队的同类技术能够成功还原 90% 打过马赛克的人脸,算是十分惊人的成绩。辉达则不满足于低解析度,希望追求更「感人」的画质。艾德斯登告诉 PingWest 品玩,该公司已在实验室中实现仅花「很快」(数秒)的时间将 1K 解析度重组为 4K 解析度画质的照片。

这种技术能为游戏带来什幺改变?辉达期待能够在未来,让游戏在小容量的基础上,显着提高材质的清晰度和视觉效果。举个例子:在射击游戏中,当玩家举起狙击枪,瞄準镜里能看到更清晰的远处画面和材质。让人工智慧开发游戏,人类玩家只有被狂虐的份

不光是辉达,Google 旗下的英国人工智慧技术公司 DeepMind,也考虑用神经网路在游戏上搞点事情──当然如果你有印象,过去曾经传出人工智慧在《敲砖块》、《星海争霸》、《毁灭战士》乃至围棋上辗压人类的新闻,大多都是 DeepMind 搞出来的……

该公司在去年训练了一个名叫 WaveNet 的人工智慧,让电脑生成的语音和人类原声越来越难以区分。WaveNet 和过去的串联式语音合成、参数式语音合成不同,将语音的初始资料(波性档案)细分到以 1 毫秒为单位区间,在每个区间之间都採用递迴神经网路(Recurrent Neural Network)和卷积神经网路进行预测学习。让人工智慧开发游戏,人类玩家只有被狂虐的份

WaveNet 的架构展示。

最后, DeepMind 用 Google 自家的 TTS 语音转文字(目前世界上得分最高的该类技术)资料集测试,比 Google TTS 的得分高了 10 个百分点──但将 Google TTS 与人类原声之间的距离缩短了一半多。让人工智慧开发游戏,人类玩家只有被狂虐的份

虽然玩游戏的时候,没人会仔细听每句对白,但不意味开发者应该在这方面节省。WaveNet 将会成为游戏开发者的福音。「想像一下,当你需要调整剧情的时候,可以用电脑生成配音,不必再花钱请配音员回来重录,甚至完全不用配音员。」卡坦萨罗称。

你可以到 WaveNet 的网站上试听一下效果,跟真人声音差距真的很小。

好吧,现在 AI 有了生成声音、视觉材质等元素的能力,接下来呢?

就在上週,游戏开发公司 Nival 宣布一个振奋人心的讯息:他们为 2015 年开卖的线上即时战略游戏《闪电战 3》开发了一个神经网路决策 AI:Boris。

在一则示範影片中,Boris 显示出「风筝」敌方单位的能力(指吸引敌对目标,带其到处乱跑以打乱策略的行为);还可以在明显具劣势时消极应战而非拚死顽抗,以达到储存火力的目的;当战场中有新敌人加入,Boris 会自动分配火力到不同目标,也会根据敌方火力级别,自动指挥士兵坐上炮台,而不是傻站在地上,用步枪拚坦克。让人工智慧开发游戏,人类玩家只有被狂虐的份

更有趣的是,当双方对抗佔点时,Boris 会选择性忽视挡路的残血敌军,优先抢点再等待机会击杀──这显示出 Boris AI 对不同奖励(reward)级别的理解,能优先追求与全域获胜关係更大的奖励。

Nival 明确表示,Boris 没有使用游戏核心任何地方资料,只使用对玩家可见的战场情况,每几秒钟进行一次决策。Boris 的更多技术细节暂未公开。

在游戏开发中应用 AI 技术,还有很大的想像空间。

去年,OpenAI 用《侠盗猎车手 5》开发出一个名叫 DeepDrive 的「自动驾驶模拟器」。由于游戏内部的车辆行驶资料应有尽有,OpenAI 发现其实可以用游戏资料来训练自动驾驶系统。虽然后来研究者移除了与该模拟器有关的内容(这里有一个 Twitter 上的影片展示,这项技术所属的专案官网还在),该事件还是令人印象深刻,它赋予了人们审视 AI 和游戏关係的新视角。

像《侠盗猎车手》这样的开放世界游戏,开发公司花费多年时间设计大量任务关卡,但速度最快的玩家不出几十个小时就能破关,继而希望获得更多内容。然而开发公司要花精力在下一款游戏上,无暇顾及上一代(实际上开发公司 Rockstar Games 的做法是用一个较小型的团队维护游戏,继续添加新的线上游戏型态)──未来,AI 会不会获得生成任务、关卡、剧情的能力,以致可以独立完成完整的游戏?

卡坦萨罗认为那样的未来会很棒,但应该只存在幻想阶段。「我觉得设计关卡和任务最难的地方在于,你怎样让新关卡和任务够有趣,这是目前 AI 无法取代设计师的地方。你可以让 AI 生成对白,生成材质,但将对白、视觉、机制和剧情进行有序、有趣的衔接,它还做不到。我想可能有些幽默只有人类懂。但我可以想像 AI 未来帮助设计师更快推出新关卡和任务,那将令人期待。」

聊到这里,我倒是有点担心了。

上一篇: 下一篇:

相关新闻

推荐阅读