人工智能的终极加速器,将是元宇宙

人工智能的终极加速器,将是元宇宙

“元宇宙是互联网的一个准后继者,在这里,每个人,每个公司都可以存在,工作,社交,交易和创造”。 —— 硅谷知名元宇宙投资人

元宇宙成为风口,提到元宇宙,我们通常首先想起的是“下一代互联网”,“AR/VR”,”NFT”,而事实上,人工智能和元宇宙的联系,可能超过我们大多数人的想象。事实上,人工智能,将在,或者说正在与元宇宙至少在以下几个领域,有深度的融合:

人工智能的终极加速器,将是元宇宙

首先AI是元宇宙天然的“先锋号”。就像物理的新大陆,需要人类探险队去探索一样, 广袤的元宇宙也需要很多探索员去检查,验证,确认和提供体验优化的洞见(尤其考虑到元宇宙会有很多不同公司不同实体的建设者)。这类工作将更适合于数字宇宙的原住民,人工智能,去完成。而通过强化学习后的人工智能模型,显然不仅仅是机械的模仿人类的操作,而是会学习最优策略,去找到数字环境中的bug和漏洞(找到后奖励最大化)。大型联机游戏本质上是一个大规模实时多进程分布式程序,玩家和玩家、环境、NPC(非人类玩家)的组合已经使得游戏开展的可能性接近于无限。事实上,有的NPC本身就是AI,这种情况下,传统的代码式测试几乎没有可能判断出游戏的所有可能场景,这个时候,用视觉智能(识别游戏物体和场景)+强化学习(探索通关)的人工智能模型,就是一种能有效减轻人类测试员工作量,发现游戏死角的方式。在游戏The witness中,开发者就使用了AI代理走遍了整个游戏小岛的场景,一旦发现有被环境卡住或者不符合物理常识的“穿越”“跨越”等等让玩家“出戏”的情况,就记录下来,供开发团队改进。不仅是pathfinding和找Bug这种累活,AI代理也可以测试游戏的通关难度,用户使用友好性,分析游戏的难点,对元宇宙这样一个充分模拟现实世界的超大环境来说,用户体验将是一个关键成功要素。我们希望充分沉浸在元宇宙中,而不是时时被提醒,这只是一个不太符合现实世界体验的环境。

往前一步看,既然目前的数字Agent能为我们测试游戏环境,提升玩家体验,那未来人类的AI代理是不是可以在元宇宙中从事更多的活动呢?我们已经看到,商汤等AI企业的数字人产品,已经在银行、电信营业厅、展馆等场所里为真实人类在提供咨询、服务和交互,在元宇宙中,是不是会有更多的数字人,数字代理,为元宇宙居民提供各类服务呢?从收养宠物替我们看门看家,到利用机器人自动驾驶物流车为我们送物送餐,到早期网络游戏中的外挂打怪升级(虽然被认为是一种作弊),人类几乎始终在寻找合适的分身代理,替我们完成我们无暇或者无需费精力去完成的任务。未来的元宇宙中,我们不仅可以自己参与各类事项,也可以训练出AI数字分身(可以认为只是一个智能型的外挂)自主去完成各类价值创造活动。

AI也是元宇宙的内容生成的强赋能者。从场景,到人物,到音乐和故事,人工智能已经开始广泛应用在了游戏,影视,视频制作,当然,也会在元宇宙中的各个领域:

2021年4月,世界上最大的GPU厂商英伟达的CEO黄仁勋在自家厨房做了一场GTC线上峰会,后来英伟达自曝,画面中老黄的厨房、标志性的皮衣,甚至他的面部表情、动作、头发等等,全都是合成出来,对一个演员的动作捕捉提供了黄仁勋的演讲动作,而人工智能将声音和动作捕捉细节完美映射到了黄仁勋的数字替身上。

英伟达也推出了一种基于生成式对抗性网络(GAN)的人工智能应用智能画笔,可以将只有一些轮廓和颜色的草图,转化成具有照片精度的图片。用户只需要用鼠标画出一些线条,颜色,然后指定特定部分为内容元素比如“天空”,“水”,“岩石”,“路”,“草”,这个人工神经网络就可以自动“脑补”填充细节。

商汤等人工智能科技公司推出的数字人方案,已经完全支持我们生成一个可以实时用表情驱动的,多种形态的数字代理。新华社的中国首个“人工智能主持人”,就采用了与数字人相似的技术,以活着的人为模板,模仿的是新华社主持人邱浩。从邱浩的外形、声音、眼神,以及肢体嘴唇动作,AI(合成)主播与真人邱浩的相似度高达99.9%。不难想象,在元宇宙中,通过AI加持,人类将可以任意为自己的数字代表选择外表,体型,服饰,声音,乃至语言习惯和部分性格。

而另一类在游戏界广泛应用的AI赋能的内容制作,就是Procedural content generation程序化生成。PCG在许多游戏中已经有广泛应用,从简单的随机物体摆放,到全自动生成武器,建筑或者AI等等。在太空冒险生存主题游戏《无人深空》中,从星球环境、生物到太空船, 乃至音乐都是程序化生成的。此外,前文提到的NPC, 非人类玩家,也在大量使用AI生成,这些AI赋能的NPC不再仅仅是按既定条件判定的代码与人类玩家互动,而是通过观察人类玩家的举动,策略,自行调整行为和方式,这种能力的背后,就是通过强化学习后的人工神经网络。在开放世界游戏“摩多的阴影”里,每一个通过AI生成的敌方“兽人”都有自己的随机生成的相貌,服饰,个性;每一个兽人,都不是一段简单的代码,而是如果一个真实玩家一般的具有游戏智能的AI。兽人和兽人之间,还会有多智能组合行为,打斗,合作,一方帮助另一方复仇,也可以增加战力,升级,类似一组玩家陪人类玩家在玩。这种游戏带来的体验,是固定程序生成的NPC和通关地图等带来的每次雷同的游戏乐趣所不可比拟的。

此外,元宇宙还是人工智能这种数字原住民天然的训练场。元宇宙是一个理想的人工智能模型训练环境,因为其一,元宇宙中有大量的数据,很多还是已经标注过的数据。互联网巨头发展人工智能会相对容易很多,是因为天然这些公司就采集了大量用户有意无意提供的高质量带指向性的数据;其二,元宇宙的无边无际的数字环境和海量用户,为强化学习的人工智能提供了反馈和指导,这是基于强化学习的人工智能模型最好的成长环境。

事实上,并不需要等到下一代互联网,这一代互联网已经是一个我们训练AI的一个环境。有一类我们已经司空见惯的,在系统登录时对系统提示的图片中的特定物体或者字体加以识别和输入,本意上,这是为了验证这是一个真人而不是一个程序在自动登录系统(以防止恶意程序消耗系统资源),而实际上,这已经是我们在互联网上为一个人工智能提供了训练。我们每次给出图片中特定的信息,实际上就是为这个人工智能提供了一个标注过的数据。亚马逊甚至会把这种数据标注的行为以众包的形式,通过提供一些物资激励,让大家去主动回复含有特定数字,汽车或者交通灯,等等的图片。 而在元宇宙中的用户,天然每天就会产生无数的这种交互行为。这就像一个商店里的学徒,当他每天要接待成千上万次客户访问,而且每次客户都会给他一些正向或者负面的反馈,那这个学徒很快就会成为一名非常合格的客户接待。这个学徒,很可能就是元宇宙中无数需要强化学习的人工智能算法中的一个。

利用虚拟环境训练智能模型的思路,也正在得到验证和使用。特斯拉在利用虚拟环境训练自动驾驶模型,而不用真的把车开到街上训练; 欧洲一家汽车模拟技术公司AVSimulation 利用UE(虚幻引擎)生成自动驾驶/人类驾驶模拟器,模拟不同路况,天气,这对一些需要极端条件数据的训练,非常有用; OPENAI也出了纯虚拟的强化学习环境来训练机器人(而最终可用于机器人的物理操作),用户可以利用这些环境来训练需要掌握特定控制或者决策能力的算法。目前的强化学习还只能应用在一些特定的游戏场景,比如“吃豆人”,“坦克大战”,或者“机器人拳击”,但随着强化学习模型和算法的成熟,这些能力的泛化看上去并不遥远。

上文提到的用以生成和辨别合成图片的生成式对抗网络,本质上也是这一类用AI来训练AI的思路。这种人工智能算法用了一个生成器和一个辨别器去相互对抗,“矛利盾坚”,生成器努力生成各种尽可能接近真实照片的人脸图像,而辨别器则努力去分辨出给到的输入是生成的还是真实照片,“左右互搏”,直到生成器生成的图片无法辨别真伪。元宇宙中,将充满不同的AI,这些擅长于某一类任务的AI,将具有成为另一类AI训练师的巨大潜力。

元宇宙将是人类有史以来最大的一个数字化项目,也会是人类自发现新大陆之后最大的对未知领域的探索,人工智能作为人类自古以来最强大的工具,必将在这个探索中,扮演极为重要的角色,也会因为这个宇宙的演化和互动,不断得到丰富和完善。

文章仅供MetaYZ学习研究资料收集,不作商业用途。转载请注明出处

(0)
上一篇 15 11 月, 2021 2:45 下午
下一篇 15 11 月, 2021 11:08 下午

相关推荐