DeepMind宣布更强的AlphaGo算法

Published by deepthink on

谷歌的DeepMind再次发表论文,宣布推出全新的算法MuZero,通过这一算法,可以加快人工智能的训练速度。目前在围棋、国际象棋、将棋以及数十个Atari游戏的学习表现当中优于目前所有算法,具体到围棋上,已经可以超越之前的AlphaZero。

传统的算法是搜索树,也就是搜索可能的各种分支。但实际上人工智能要解决的问题往往非常复杂,只用搜索树来构建算法效率低下。Deepmind提出了搜索树和已学习的人工智能相结合的算法,称之为MuZero。

黄色是原有AlphaZero的水准,蓝色线是MuZero

上图是MuZero算法的威力:都运行100万步之后,MuZero的水平明显超过了橙色的线,也就是之前AlphaZero的水准,可以看到MuZero的围棋能力以及超过了elo5000以上,并且还有上升空间,拿下国际象棋、将棋和Atari游戏也不在话下。

现在可以和AlphaStar打星际了

只是不知道谷歌何时才能发布一个可用的MuZero供围棋爱好者使用,起码在电竞领域已经有可以的超强人工智能AlphaStar陪玩家游戏了。

 

Muzero :  https://www.chainnews.com/zh-hant/articles/175196541080.htm

 3,021 total views,  4 views today

Categories: AI智能