您的位置:首页 >创业 >

Google支持AlphaGo的重大胜利: AI如何破解中国古代游戏

谷歌拥有的DeepMind的AlphaGo,一个计算机程序创造了历史。AlphaGo是一个通用的人工智能 (AI) 程序,现在在中国古代围棋比赛中击败了世界冠军李世石。李在五场比赛系列赛中取得了一场胜利; 最后一场比赛将在3月15日进行。AlphaGo背后的公司DeepMind被谷歌2014年收购,现在是其人工智能努力的核心。

这不是AlphaGo第一次在围棋比赛中击败人类冠军。在2016年1月,AlphaGo在Go击败了卫冕欧洲冠军范辉。AlphaGo以5-0击败Hui。这就是为什么AlphaGo对Lee Sedol的最新胜利如此重要的原因。

观看AlphaGo vs Lee Sedol的第四场比赛

围棋是什么游戏?

围棋是一种古老的中国游戏,在东亚很流行。在中文中,游戏称为weiqi,在日本为igo,在韩语中称为baduk。仅在中国,就有6000万多人观看了第一款在线游戏,全球有10000万多人观看了在线直播。

该游戏是在19 × 19网格正方形的棋盘上进行的,带有黑白石头的游戏有一个目标: 用石头包围空置区域,占领棋盘的50% 以上。黑色在此首先开始,玩家只能将石头放在网格的交叉点上。

游戏一直持续到双方都同意没有更多的地方可以放石头,或者直到一方决定以明显的损失辞职。游戏结束后,每个玩家都会计算其领土内的空位数量。玩家可以捕获竞争对手的石头,然后将其称为囚犯。每个囚犯都有加分。石头一旦放在木板上,就不能移动。

有两个简单的游戏规则: 一块石头必须至少有一个自由才能在游戏中生存。自由是石头周围向上,向下,向左向右的开放点。石头也可以是一个集团的一部分,该集团至少有一个这样的自由。另一个是玩家不能重复先前在棋盘上移动时完全相同的石头位置。

该游戏已有3,000多年的历史,世界各地有超过4000万名围棋玩家。韩国,甚至有专门的电视频道全天播放围棋比赛和教学策略。

那么,为什么学习这个游戏对计算机来说是一个挑战呢?

与更加合乎逻辑的国际象棋不同,围棋游戏被视为直观的,这是计算机无法掌握的。正如DeepMind的科学家指出的那样,与国际象棋的 “深蓝” 计划不同,他们不能仅仅使用 “蛮力” 搜索方法在Go中击败玩家。蛮力将需要对所有可能的动作进行全面而详尽的搜索。除非围棋是不可能的; 依靠提出可能的动作的搜索树太大了。

正如Google DeepMind的首席执行官Demis Hassabis在一个视频中解释的那样,围棋游戏中的配置比宇宙中的原子更多; 虽然国际象棋有20个典型的动作,但在围棋中,你可以在某一时刻有200个潜在的动作。他进一步说,一些世界顶级围棋选手可能经常将此举归因于直觉,或者因为感觉正确,这是您无法轻易教计算机的事情。

那么AlphaGo是如何工作的呢?

AlphaGo使用两个深度神经网络 (受生物神经网络启发的人工网络) 来模仿围棋专家的动作。DeepMind向它展示了数百万个围棋位置和来自人类游戏的动作。

阅读更多

Deepmind的AlphaGo在第二场比赛中击败中国围棋冠军google的AlphaGo AI在古代棋盘游戏中击败中国冠军StonesDeepMind的AlphaGo AI的字母在最后的比赛中击败了人类冠军Lee Sedol

第一个使用的神经网络称为策略网络,另一个是山谷网络。AlphaGo并没有一次性考虑所有动作,而是通过政策网络专注于开始时的一些有希望的动作。山谷网络减少了搜索的深度,而不是一直走到游戏结束,它看起来是一个更合理的数字,比如20步。

谷歌的DeepMind科学家称这种搜索方式 “更类似于想象力”。AlphaGO程序也在内部进行评估,它每天可以玩数百万个游戏,这是人类无法做到的。

为什么胜利如此重要?

对于DeepMind和AlphaGo来说,对Lee Sedol的胜利标志着人工智能将如何发展的未来迈出了一大步。实际上,专家们认为,计算机还需要十年的时间才能在Go中击败人类。

当第一场胜利发生时,哈萨比斯将胜利与登月进行了比较,并在推特上写道: “# AlphaGo获胜! 我们把它降落在月球上。为团队感到骄傲!! 也要尊重令人惊叹的李世石。“

正如Demis Hassabis在会议后的第二场比赛中所解释的那样,这些比赛的想法也是为了找出AlphaGo的弱点。

“AlphaGo对整个游戏的表现有一个估计,这并不总是正确的。在下半场 (第二局),它变得更加自信。这些比赛将帮助我们了解是否缺少某些东西,并探究AlphaGo的弱点,”他在新闻发布会上说。还应该注意的是,程序员无法在每次游戏后纠正或修复AlphaGo,以教它新的动作,程序自行学习。

输掉第二场比赛后,人类围棋冠军李世石说他无语,并补充说他根本不觉得自己在第二场比赛中领先。“AlphaGo玩了一场近乎完美的比赛,” 这位在位的人类冠军在第二场比赛结束时说。

然而,第四场比赛也表明AI能够出错。“我们来这里是为了了解AlphaGo犯了什么错误。这场失利对我们来说非常有价值,我们还不知道我们发生了什么,一旦我们回到英国,我们将仔细分析比赛,”哈萨比斯在赛后发布会上说。

使用Ap输入

相关推荐

猜你喜欢

特别关注