news center

AI学会用简单的英语说明来玩视频游戏

AI学会用简单的英语说明来玩视频游戏

作者:柏操菟  时间:2018-01-02 16:23:02  人气:

Atari By Edd Gent人工智能通过简单的英语讲解,学会了解决最艰难的Atari视频游戏之一该系统由加利福尼亚州斯坦福大学的一个团队开发,学会了玩Montezuma's Revenge游戏,其中玩家在阿兹特克神庙中搜寻宝藏人工智能学习游戏很有挑战性,因为它提供了稀疏的奖励,要求玩家在获得任何积分之前进行多次移动大多数视频游戏AI都使用强化学习来制定策略,依靠游戏点等反馈来告诉他们什么时候玩得好为了帮助他们的AI更快地获得游戏策略,斯坦福大学的团队以自然语言指令的形式为他们的强化学习系统提供了帮助,例如建议它“爬上梯子”或“获得钥匙” “想象一下,教孩子打网球,把球拍放在球机前10年这基本上就是我们现在如何教AI,“团队成员Russell Kaplan说 “事实证明,孩子们可以通过教练更快地学习”以这种方式教授AI可能会有深远的应用,因为使用自然语言意味着任何人都可以建议AI,而不仅仅是计算机程序员该小组首先训练AI将指令与在游戏中执行的相同动作的屏幕截图相关联然后,他们让游戏角色通过的每个房间的指令列表练习游戏,奖励它完成命令和进行游戏为了表明它正在对诸如“爬上梯子”这样的命令进行一般性的理解,研究人员进行了另一项实验,他们删除了第二个房间的训练数据卡普兰表示,该系统仍然能够遵循该房间的说明,尽管之前没有看过它们,这表明它不仅仅是死记硬背相反,它可能是从先前的指令推广当它找到更好的策略时,它也学会了忽略指令该系统在游戏中获得了3500分,粉碎了OpenAI Gym的最高分2500,OpenAI Gym是一个在虚拟环境中测试AI的在线平台谷歌DeepMind AI在游戏中的得分高达6600,但它的训练时间几乎是后者的两倍它将强化学习与一种称为内在动机的方法结合起来,这种方法可以奖励人工智能,使其感到好奇并探索其环境卡普兰说谷歌的方法更先进,但他认为这两种方法是互补的,并希望尝试将它们结合起来该小组还计划在人工智能通过游戏进行时减少指令数量,以查看它从被告知的内容中学习的速度,并停止依赖此类指导 Carnegie Mellon大学的Devendra Chaplot表示,使用自然语言指导是一种有趣的方法 “这非常有用,因为它为人类引导人工智能系统提供了一种自然的方式,”他说然而,将其翻译成现实世界可能是一个挑战 “该项目使用一套固定的指令,但理解自由形式的自然语言指令是一个非常具有挑战性的开放性问题,”Chaplot说卡普兰说,对他们有利的一件事是各种丰富的数据集将现实世界的图像与自然语言描述联系起来,可以用来帮助训练这样的人工智能期刊参考:arXiv,DOI:1704.05539关于这些主题的更多信息: