news center

DeepMind的Go播放软件现在可以在另外两款游戏中击败你

DeepMind的Go播放软件现在可以在另外两款游戏中击败你

作者:窦育锰  时间:2019-02-03 08:08:01  人气:

Tristan Fewings / Getty DeepMind的AI Go大师自学了新技巧最新版本的机器学习软件,被称为AlphaZero,现在也可以在国际象棋和棋牌上击败世界上最好的 - 这是一种类似于国际象棋的日本游戏,但在更大的棋盘上玩更多棋子谷歌的姊妹公司DeepMind声称,它是第一个可以学习超人能力的机器学习系统 AlphaGo在2016年成为头条新闻,当时它在一场长期以来被计算机破解的游戏中击败了世界上最好的玩家然后是AlphaGo Zero,它不仅超越了AlphaGo,而且在没有看过人类玩游戏的情况下自学了这么做 AlphaGo Zero不是通过分析数百万人玩游戏来学习如何玩,而是没有人类输入它基本上被赋予游戏规则并且在一个盒子里闭嘴,直到它成为世界上最好的Go玩家花了三天时间 Chess和shogi播放软件通常被赋予游戏规则并使用强力搜索来找到最佳的下一步动作 AlphaZero反而推广了AlphaGo Zero方法使用相同的算法,它教会自己从头开始掌握围棋,象棋和棋子除了在Go上击败AlphaGo Zero之外,它还可以最好地领导已经超越人类的国际象棋和将棋软件 DeepMind团队认为,AlphaZero让我们更接近人工智能,可以自学各种游戏 “这是非常好的工作,”纽约大学的Julian Togelius说,他从事游戏AI “这是一个聪明的算法”但他认为我们在谈论一般人工智能时需要小心我们的意思 AlphaZero是通用的,因为相同的软件可以学习不同的游戏但是一旦受过训练,系统就无法获取所学知识并将其应用到其他地方 “受过国际象棋训练的网络不能玩Go,反之亦然,”Togelius说 “要玩另一个游戏,系统必须从头开始重新训练”换句话说,AlphaZero的单个实例不能像人类一样玩三种游戏 Togelius还指出,这种超人AI需要使用5000个TPU - 或张量处理单元 - 这是一种由谷歌专门设计用于机器学习的芯片 “这绝对是一种疯狂的计算能力,”Togelius说 “只有主要的科技公司可以访问它,所以没有人能够正确地复制这项工作期刊参考:Science,DOI:10.1126 / science.aar6404关于这些主题的更多信息: