AlphaGo2.0大战柯洁,向强人工智能再迈进一步!

7:28
 
分享
 

Manage episode 213098569 series 2399375
由Player FM以及我们的用户群所搜索的大王_Maxwang — 版权由出版商所拥有,而不是Player FM,音频直接从出版商的伺服器串流. 点击订阅按钮以查看Player FM更新,或粘贴收取点链接到其他播客应用程序里。

还记得去年的围棋人机大战么?AlphaGo大战韩国9段棋手李世石,最终AlphaGo以4:1的成绩赢得了比赛。现在AlphaGo又来了,这次对弈的就是,世界围棋排名第一的,19岁中国围棋选手柯洁。本次对对弈将在围棋的发源地浙江乌镇举行。


相信现在没有人不知道AlphaGo了,他已经成为了人工智能的代名词,他与柯洁的对弈早在去年就基本已经注定了,有人说柯洁已经是人类最后的防线了。


我们先来看看为什么AlphaGo去年赢了李世石后没有马上与柯洁对战,今天回来的AlphaGo又闭关修炼了什么本领?


在去年的时候AlphaGo可以说是1.0版本,我们都知道它的本领就是可以深度学习,在学习了3万多幅专业棋手对局,并自我博弈不断训练后。通过超大的计算量来分析整盘棋局,找到获胜概率最大的位置来落子。而后Master出现在人们视野里,现在大家也知道,这个就是AlphaGo的的升级版。而再度升级的AlphaGo2.0版本就是即将对弈柯洁的最新版,它除了他采用深度学习的方法,还加入了强化学习。这一次他把人类的棋谱给摒弃了,下棋的时候不在遵循人类3千年来总结的经验下棋,而是自己来决定如何落子。


这当中好像有点难理解,1.0的AGo所有棋路的下发都是模仿人类,我们知道下棋的人要学习棋谱,里面有几万种互相破解的下法,而AGo当初就是按照这个棋谱的下发来与李世石对弈的,如今抛弃了这个棋谱,也就是说这些人类依赖的几千年的经验总结他已经不用了。没有了这些参考,也就摆脱了限制,落子在哪里已经不是从这些经验里面来决定的了,而是完全靠自己的计算。


而这也就代表了这次的对弈是真正意义上的人工智能对战人类大脑。

43集单集