来源: 时间:2022-05-09 15:35:41
科学家,包括印度血统之一,已经开发了一种新的人工智能 (AI) 系统,可以在流行的视频游戏吃豆人上实现999,990的最大可能得分。来自加拿大初创公司Maluuba的团队使用AI的一个分支称为强化学习,完美地玩了20世纪80年代街机游戏《吃豆人》。
加拿大麦吉尔大学副教授Doina precup表示,这是AI研究人员的一项重大成就,他们一直在使用各种视频游戏来测试其系统,但发现吃豆人是最难破解的。
为了获得高分,该团队解决了将吃豆人掌握成小块的大问题,然后将其分配给AI代理商。
这种轻取和征服的方法可能对教AI代理执行增强人类能力的复杂任务具有广泛的意义。该方法类似于有关大脑如何工作的一些理论,并且可能对教AIs在有限的信息下完成复杂任务具有广泛的意义。
Maluuuba团队称之为混合奖励体系结构的方法使用了150多个代理,每个代理都与其他代理并行工作,以掌握吃豆人。
例如,一些特工因成功找到一种特定的药丸而获得奖励,而另一些特工则被要求远离鬼魂。
然后,研究人员创建了一个顶级代理商-有点像公司的高级经理-他接受了所有代理商的建议,并利用它们来决定将吃豆人搬到哪里。
顶级代理商考虑了有多少代理商主张朝某个方向前进,但也考虑了他们想要采取这一行动的强度。
例如,如果100特工想向右走,因为那是通往他们的药丸的最佳途径,但是三个人想向左走,因为右边有一个致命的鬼魂,这将给那些注意到鬼魂并向左走的人带来更多的负担。
Maluuuba的项目经理Rahul Mehrotra说,弄清楚如何赢得这些类型的视频游戏实际上非常复杂,因为您在玩游戏时会遇到各种各样的情况。
Mehrotra说: “许多从事人工智能工作的公司都使用游戏来构建智能算法,因为有很多类似人类的智能能力,你需要击败游戏。”
相关推荐
猜你喜欢