这篇文章好棒！Alphago进化史漫画告诉你Zero为什么这么牛

Published by deepthink on May 30, 2020May 30, 2020

来源：环球科学ScientificAmerican公众号

那么AlphaGo Zero与AlphaGo（用AlphaGo表示以前的版本）都有哪些主要的差别呢？

1。在训练中不再依靠人类棋谱。AlphaGo在训练中，先用人类棋谱进行训练，然后再通过自我互博的方法自我提高。而AlphaGo Zero直接就采用自我互博的方式进行学习，在蒙特卡洛树搜索的框架下，一点点提高自己的水平。

2。不再使用人工设计的特征作为输入。在AlphaGo中，输入的是经过人工设计的特征，每个落子位置，根据该点及其周围的棋的类型（黑棋、白棋、空白等）组成不同的输入模式。而AlphaGo Zero则直接把棋盘上的黑白棋作为输入。这一点得益于后边介绍的神经网络结构的变化，使得神经网络层数更深，提取特征的能力更强。

3。将策略网络和价值网络合二为一。在AlphaGo中，使用的策略网络和价值网络是分开训练的，但是两个网络的大部分结构是一样的，只是输出不同。在AlphaGo Zero中将这两个网络合并为一个，从输入到中间几层是共用的，只是后边几层到输出层是分开的。并在损失函数中同时考虑了策略和价值两个部分。这样训练起来应该会更快吧？

4。网络结构采用残差网络，网络深度更深。AlphaGo Zero在特征提取层采用了多个残差模块，每个模块包含2个卷积层，比之前用了12个卷积层的AlphaGo深度明显增加，从而可以实现更好的特征提取。

5。不再使用随机模拟。在AlphaGo中，在蒙特卡洛树搜索的过程中，要采用随机模拟的方法计算棋局的胜率，而在AlphaGo Zero中不再使用随机模拟的方法，完全依靠神经网络的结果代替随机模拟。这应该完全得益于价值网络估值的准确性，也有效加快了搜索速度。

6。只用了4块TPU训练72小时就可以战胜与李世石交手的AlphaGo。训练40天后可以战胜与柯洁交手的AlphaGo。

3,809 total views, 2 views today

星位处于四线，一般来讲，星布局重视取势，而且由于星是一手棋占角，布局速度较快。所谓“三连星”布局是指在形成“二连星”之后在两星之子的中间星位上投子，构成三手棋均在相连接的星位上（黑三子同在一条直线上）。这两种布局都比较流行，“二连星”是“三连星”的前身，“三连星”是“二连星”的发展和延续。 6 挂角后， AI计算出来的一些变化黑1 单跳变化小飞黑不理，反挂右下角 #三连星 214,582 total views, 33 views today

AI智能

世界AI围棋大赛第2日战罢里拉零等五队领跑

「福建海峡银行杯」2020世界人工智能围棋大赛第二天进行了第3-5轮比赛，从9：30到23：00，是最艰苦的一天。经过昨天的考验，大部分团队都逐渐适应了用时和贴目规则，理解了这实际上就是中国数子规则贴6.5目的版本，大部分时候等价於日韩规则。比赛也渐入佳境高潮迭起。第三轮对阵强弱较分明，热门团队纷纷获胜，赛前呼声最高的卫冕冠军星阵也轻松击败了此前未尝败绩的采薇。第四轮进入了强强对话模式，催生了多盘精彩对局。上届亚军小爱对阵美国热门开源程序KataGo，双方都是赛前呼声很高的团队，此前都是1胜2败，此轮再输几乎等於提前被淘汰。双方一上来就火药味十足，第37丶38手气合转换令人惊爆眼球，事後看白38的「冲动」或许是造成全局被动的原因。棋局进行至百手时白棋27个子的巨龙必须强撑一个黑棋KataGo近乎无忧的劫，危在旦夕。这时白使出浑身解数弃掉左上大角惊险突围，并反吃黑中腹九子。棋局意外进入细棋格局。後半盘官子阶段KataGo对规则理解准确，牢牢把握盘面7目的优势并准确pass，小爱同样回以停着，系统判定黑184子，黑胜0.25子。这是人工智能世界赛历史上第一次双方程序都能完美执行黑贴6.5的数子规则。卫冕冠军星阵本轮执白，遭到了「有AI杯」「民间」冠军超然围棋的强烈阻击，布局右上白角留下的劫争如引而不发的定时炸弹一直保留到终局。受此掣肘白方在中腹战斗一直不敢发力，最终231手第二次中盘认负大爆冷门。上轮完败於星阵的采薇曾在第二轮时杀掉超然大龙，超然竟如负气孩童般连续停着直至全盘死光，更让人连呼AI比赛结果神鬼莫测。第一台，仅有的两支全胜队逸乐执黑对阵LeelaZero更是充满戏剧性，比利时LeelaZero在大部分时间掌握优势，进入黑棋盘6的胜势局面，但在最後收单官阶段突然断线，有知情人称LeelaZero本身不能识别此次的6.5规则，断线是为了换替身上来执行关键的pass胜着。不料不知为何替身未能在剩馀的3分多时间内登录，遗憾胜势反遭超时败。更有好事者称逸乐其实也未必会pass，早知还是不换为妙。本轮最精彩的棋局当属老牌冠军韩国石子旋风对阵爱奇，执黑的石子旋风序盘发挥出色占据主动，219手主动扑入一个有很多本身劫的对黑有利的两手劫争。不料爱奇一边收官一边顽强撑劫，黑方占着劫材有利有恃无恐。这个劫一直打了90步，309手黑棋胸有成竹地消劫，不想却陷上方包围白死棋的巨龙於黑输不起的天下大劫，最终黑眼睁睁看着上方四块棋累计85颗棋子的死活逆转却无劫材，不甘心地超时负。第五轮第一台唯一全胜的逸乐执白通盘被天狗压制，最终逸乐左下8子被吃，中腹35子大龙还是打劫活惨不忍睹。之前仅负於星阵的大黑马采薇在细棋局面下官子细腻，不断拉开差距轻松击败爱奇。前五轮黑胜24局，白胜26局。各队表示6.5的贴目使轮到黑棋时彻底放下了大贴目的心理包袱。随着程序员对适时虚手规则的理解加深，相信到决赛阶段不会再出现轮流填子将胜机推给对手的幽默场景。五轮过後无全胜队，同为4胜的天狗丶采薇丶逸乐丶超然丶LeelaZero五队并列榜首，星阵丶石子旋风丶KataGo丶爱奇丶隐智五队3胜命运依旧掌握在自己手里。昨日全胜的弈小天和手谈今天都遭遇三连败，要想出线明日必须全胜才有资格比小分，机会已有些渺茫。上届亚军丶多年坚持自主研发，手握国家级重点资助的韩国小爱仅获1胜4负，提前惨遭淘汰，也从侧面印证了人工智能围棋一年来的技术进步，很可能远超大多数棋友的想像。第六轮对阵如下： 133,356 total views, 6 views today

AI智能

世界AI围棋赛首日战罢里拉零等四款软件两连胜

来源：吴清源杯组委会 9月27日，「福建海峡银行杯」2020世界AI围棋赛在福州数字中国会展中心打响，本次世界人工智能围棋大赛云集了来自五个国家的20支高水平队伍，整体上代表了当今围棋人工智能发展的高水平。比赛过程中局部定式新型频出，对局过程不乏亮点。这次比赛是人工智能比赛第一次采用「黑贴3又1/4子，当白先弃着时黑多贴1/2子的」新规则，对各队程序员提出了新的考验。参赛软件参赛软件上午第一轮比赛就冷门迭爆，卫冕冠军星阵似乎还没进入比赛状态，中盘在优势局面下弈出败着负於LeelaZero。上届亚军韩国小爱因硬件故障及DNS解析设置错误迟到超时被判负於老对手弈小天。赛前呼声很高的美国开源程序KataGo在胜势下不慎超时负於超然围棋。手谈执白对阵小飞围棋，在黑184子的局面下双方均错过很多弃着终结比赛的机会，最终30年前的冠军手谈290手率先弃着获得胜利。此外采薇围棋在盘面6目的局面中准确弃着把握住了胜机，以1/4子击败AlphaGo前的世界冠军石子旋风，日本BSK因网络延迟和时间设置失误超时负於大胖围棋。此外逸乐围棋丶爱奇围棋丶天狗围棋丶隐智围棋分别击败了飞虎队丶棋之魂队丶威狐围棋丶清石围棋。第二轮有的队还没就位，星阵就已速胜棋之魂队，全盘仅花费10分钟。热门队伍韩国小爱和美国KataGo再遭重创，中盘负於威狐围棋和石子旋风。弈小天败势下继续运气爆棚，超时胜天狗围棋。着名开源程序LeelaZero击败爱奇围棋获得二连胜，隐智围棋丶BSK因设置失误不慎超时负於手谈丶飞虎队。此外逸乐击败大胖，黑马采薇完胜超然，小飞击败清石。两轮战罢，比利时LeelaZero携中国的弈小天丶采薇丶手谈丶逸乐均获两连胜并列第一，美国KataGo丶清石丶日本BSK丶韩国小爱丶棋之魂队两战全败积分垫底。 119,198 total views, 5 views today

这篇文章好棒！Alphago进化史 漫画告诉你Zero为什么这么牛

Related Posts

定式

AI推演-开局定式的一些变化 – 三连星

AI智能

世界AI围棋大赛第2日战罢 里拉零等五队领跑

AI智能

世界AI围棋赛首日战罢 里拉零等四款软件两连胜

这篇文章好棒！Alphago进化史漫画告诉你Zero为什么这么牛

世界AI围棋大赛第2日战罢里拉零等五队领跑

世界AI围棋赛首日战罢里拉零等四款软件两连胜