把GPT-4接入《我的世界》,科学家正在发掘AI的新潜力
AI究竟还能完成什么出乎人类意料的工作?最近,Nvidia公司的人工智能研究员把语言模型GPT-4引入到了沙盒游戏《我的世界》中,试图从中发掘出AI更复杂的能力。
5月25日,英伟达团队与加州理工学院等诸多高校在内的研究者们发布了Voyager,按照他们在论文中下的定义,Voyager是一个具有大型语言模型的开放式具象化智能体,被接入到自由度较高的电子游戏《我的世界》中。
AI在游戏中实现的各种操作
Voyager被赋予的任务是完成游戏中存在的各种目标,包括了生存、战斗以及建造,并且随着游戏时间和经验的积累逐步提高自己的技能。
在实验中,Voyager并不能像人类一样正常地感知、操作游戏,而是通过API直接读取游戏的各种信息。假设在《我的世界》地图上存在一条小河和一根钓鱼竿,当Voyager识别到这两个信息后,GPT-4便会建议钓一些鱼来获得经验。
而当系统生成了这个目标后,GPT-4就会自动生成实现目标所需要的代码,以此让角色完成相应的动作。
这个项目最创新的部分在于是用GPT-4来生成驱使游戏人物行动的代码,而AI的实现逻辑和人类一样,第一次尝试某个任务时难免会失败,但它会收集错误信息和游戏反馈,根据状况调整代码并最终完成任务。
随着游戏时间变长,Voyager建立了一个自己的代码库,以便更快速地建造游戏里种类繁多的道具,这种行为也可以理解为AI正在累计自己的游戏经验。研究人员将Voyager的游戏进度与其他人工智能代理做对比,结果发现Voyager获得的物品数量是其他AI的三倍,探索的距离、建造物品的速度也远胜其他对照组。
相同时间下,Voyager是最先做出钻石剑的
之所以选择《我的世界》作为测试GPT-4的试验场,是因为这款游戏自由度高且没有过于明确的目标,AI如果想做到“玩得好”,那就需要进化出一些和人类玩家类似的能力,研究人员总结了几个关键技能。
比如“根据其当前的技能水平和世界状态提出适合的任务”——当身处沙漠时,AI会考虑先收集仙人掌而不是铁矿。再比如“根据环境反馈改进技能,并将掌握的技能保存在记忆中”——作为敌人,僵尸与蜘蛛类似,那么打僵尸总结的战斗经验就可以用在蜘蛛上。
当然,教AI玩游戏,最终试图实现的目标还是在游戏之外,研究人员表示通过这种方式训练语言模型,将来或许可以使许多日常办公任务自动化,或者根据使用者提出的需求来自动实现某些效果。
不过虽然前景美好,该项实验依旧还停留在初期阶段,想真正把让你头疼的工作交给AI,或许还要等待一段时间。
参考资料:https://voyager.minedojo.org/