人工智能围棋这麽下 弃子转换变化太快(多谱)

3月3日,2020华为手机杯中国围棋甲级联赛第二轮,A组深圳宏发与潍坊高新区的主将之战,时越对阵伊凌涛一局的转折之处,人工智能给出了很有趣的变化,值得分享。 图1:时越执黑对阵伊凌涛。右下角白棋死活有些微妙,局势也到了转折之处。实战进行如图,但这里人工智能(新浪围棋棋谱直播辅助讲解的人工智能程序)和人类的选择出现了很大分歧。 图2:人工智能一直强调中央白3补棋,甚至不惜放弃右下角。白棋留下一些味道後,抢先搜刮左边黑棋,人工智能判断这样是白棋领先的局面。 图3:作为人类棋手第一感肯定是先做活,不过黑4提劫白棋有些难受,委屈苦活肯定是不能接受的,只能选择打劫。 图4:实战进行,白棋虽然打赢了劫争,但右边被黑棋一分为二,最後上边一串棋子还被黑棋吃掉,黑棋由此取得优势。 图5:人工智能认为黑棋冲的时候,白棋还是要在1位飞,照应右边,甚至还要3位跑出征子与黑棋战斗,这个图恐怕人类棋手做梦也想不到。 人工智能总是有些匪夷所思的招法,无论是在布局和中盘,但其核心理念是转化和平衡,没有什麽不能弃,没有什麽不能变,这或许是人工智能给人类棋手最大的启迪。 (周游)  4,634 total views,  2 views today

 4,634 total views,  2 views today

「尽信AI,不如无AI」丶「役AI ,而不役於AI」

Deepmind 刊登在Nature 的关键论文「Mastering the game of Go with deep neural networks and tree search」叙述了Alphago 的运作原理;不久,Deepmind 又在Nature 上发表了「Mastering the game of Go without human knowledge」一文,展示他们更为强大的新版围棋程式AlphaGo Zero,验证了即便在像围棋这样最具挑战性的博弈领域,也可以通过纯粹的和自己对弈之方式来达到自我完善的目的。 目前,AI 的思维方式乃使用了蒙地卡罗搜寻,结合两个深度学习神经网络。据开发公司称:其既可结合树状图的长远推算,又可像「人类大脑」一样自发地学习,进行「直觉」训练并培养「价值判断」,提高围棋实力。是否真的如此?以下简单说明: 蒙地卡罗搜寻法 (Monte Carlo Tree Search, MCTS) 用以下四个动作进行搜寻的工作: 1. 选择 (Selection):即随机选择一个子选点。 2. 扩充 (Expansion):在前述子选点下,再创建一个子子选点。 3. 模拟 (Simulation):以前述的子子选点为基础,进行一场模拟的博弈,称为一个rollout。 4. 逆向传播 (Backpropagation):将博弈的结果传输回去,建立激励的反馈,并以此更新权重。 以养鱼来比喻。假设池子里有许多鱼苗,我们的目的是培育出可以出国比赛拿金牌的冠军鱼。鱼饲料是我们可以运用的工具:先随便乱撒一些鱼饲料,看哪些鱼会来吃,这叫做「选择」;等到有几只来吃了,再喂它们多吃一粒,这叫做「扩充」;之後观察其表现,看哪几只比较朝气蓬勃,游得活蹦乱跳的,叫做「模拟」;表现好的,就记住其样貌长相,等到下一次喂食时,就把鱼饲料集中喂给这几只,叫做「逆向传播」。当然,前述的搜寻程序还是继续进行,如果在随机撒鱼饲料的过程中,又发现了新的可造之材,那麽重心就会移转到这些具有冠军潜力的鱼苗上面,除非此种情况发生,否则一开始发掘的几只鱼苗还是会持续地培育下去,把它们愈养愈大。 AlphaGo 的成功关键在於策略网络 (Policy Read more…

 5,539 total views

人类下棋需要理由——AI下棋只靠机制产生

作者:王铭琬 认识AI(人工智慧)最前线,王铭琬为你做最佳向导!2016年3月韩国棋王李世乭与AlphaGo的一战,人类败北後,世界开始认真面对AI(人工智慧)时代的来临!AI可能提高生活品质,也将可能挤压人类的生存空间,认识AI最前线的围棋AI,是思考人类如何面对AI的第一站! 一位顶尖职业棋士全力挥棒的报告书:王铭琬是世界唯一参与围棋AI开发的一流棋士,详尽叙述围棋AI的过去丶现在,并以职业棋士观点提示人类如何因应与AI共存的未来,因为此刻「未来还掌握在人类自己的手里!」 死活,围棋最基本认识之一 下围棋最基本的认识或技术,可以说就是「死活」吧!众所周知,围棋吃子的规则是把对手包围起来後,可以吃掉,从棋盘上提取(如图一丶图二) 。 这可以说是围棋唯一的规则 ,决定胜负的方法,跟象棋或日本将棋只要擒王就胜利不同。围棋是以「最後在棋盘上剩下的子较多的一方胜利」,也就是以棋盘盘面全体的总数来分胜负。 围棋虽如前所说明的是「围地更多的一方赢」,但是为了「比对手留下更多子」在棋盘上,则必须「比对方围得更大」才行,都是同样的一回事。 围棋的「围」有围对方的棋子跟围地两个意思;围棋的棋子是不会动的,自己的棋子在棋盘上越多越好,棋子在棋盘上,形成不被吃掉的形状,叫做「活」。 图三:下黑1,就做了「活」的形状。 图四:因为A跟B两个地方都被黑子所包围,根据「围住就能提取」的规则,白A丶B两个点都不能下,这样的点叫作黑棋的「眼」;黑下1确保两眼的话,白棋不可能吃到黑棋,黑棋数子到最後就可以留在盘上。 图五:要是反被下白1,黑棋最後就会遭被提取的命运。 图六:此後白1之後,黑下2围住白二子时,虽黑也同时被白包围,能提取对方的棋子时,就可以下,也就是下黑2的话,可以提掉白2子。 图七:但接下来,白再将1扑进去,黑也只好2提。 图八:到最後下白1,就能把黑子全部提掉。 图九:结果黑子全部被提掉了。图五下了白1的状况,在围棋称为「死」;必须先知道什麽是「活」,否则最後会被提掉,也无法获胜。所以「两眼活」不是规则,而是不被提取的技术。 棋子的死活,是最基本而重要的认识,图四是「活」之中,最单纯的形状。 围棋的变化非常多,关於死活也可以有无限的变化与外观;就像日本将棋有所谓「诘将棋」一样,围棋也有以「死活」为问题形式的「诘棋」,会下棋的人都知道,做诘棋题是提高棋力不可或缺的训练。 在日本将棋,电脑最擅长将死对手,对局时绝对没有看走眼的。 因此围棋AI常被认为很擅长死活,但事实上如前所介绍的,围棋AI对死活并不拿手;人脑的话,很简单地能在棋盘中认识「局部」,然後判断是「活」还是「死」,但是就算是厉害的Master,也还无法做到。 围棋AI对自己的孤子也会做活,但它不像人一般,心想「这样下就活了」,而是因为「下那里就不会输」的计算结果,并非和人一样具备「活」的概念,若硬要教它「活」,它反而没办法下得的那麽好;如果在序盘出现诘棋般的棋形的话,人类会比Master更能正确地把握状况,但这跟比赛的输赢是两回事。 电脑并非不会做诘棋,从几年前起,就有解答诘棋的电脑软体商品,不管多难的诘棋都能瞬间得出正解(只有一个问题是,围棋有所谓「劫」的现象,「劫」又有各式各样的种类,电脑还无法判别「劫」的种类,但将来大概是能解决的)。但这是专门解答诘棋的软体,诘棋是「局部问题」,也只能用局部去解决;对局用的AI是没有「局部」概念的。 从刚才一路在介绍棋子的死活,都是单方被包围的情况,实战不只单方遭到包围;也会出现双方都有危险,哪方都可能被提掉的局面,叫做「攻杀」。围棋的实战,比起单方的「死活」,「攻杀」的场面出现的次数更多,「攻杀」在实战其实比「死活」更为重要。 如第三章Crazy Stone对多贺战时所说明的,「攻杀」也是局部问题,AI至今还没完全解决不擅长攻杀的毛病,人想要胜过Mastr的话,把它诱导到难解而没有转馀地的攻杀局面,大概就有机会吧! 大小,围棋最基本认识之二 围棋的基本认识还有一个,就是「大小」。 围棋最终的目的是取得较多的「地」(阵地),自己下的一手棋能确保多少地,或是能破坏对手多少地,这是能用数字明白表示出来的;计算方法是「自己在一处着手後,与该处被对方下到後的差距」。 图十:下到黑1的话,可以确保A的1个空点(1目)。 图十一:如果被反过来下了白1的话,则谁也没能确保A的空点,A成为没有意义的点「单官」,日文里说「没意义丶不行」的用语「駄目」,就是「单官」一词的日语。 图十与图十一的差是A的一点之差,因此图十的黑1与图十一的白1叫做「一目棋」,围棋的所谓大小是这样得来的;但在实战,还要兼顾全局的「死活」的状况,许多局面无法单纯换算成数字,但若能很明显地呈现「大小」的数字的话,对於下棋的人而言,就求之不得。例如: 如图十二般的局面,A是後手三四目大的棋,已告确定,但其他着手的价值却未能确定;从经验上来看,这个局面的三四目,被认为是比其他的手还要「大」。 几乎所有下棋的人都会下A。 但在实战时,很少像这样在局部就完结的例子,大小无法很明白地用数字表现出来的情形比较多;但职业棋士事实上在脑里有个约略评估的数字,然後继续下下去的;围棋除了死活成为问题的局面以外,大半对弈的局面是以「大小」占思考的中心;以明白的数字来呈现的大小,跟死活一样,是局部完结的问题。 人类下棋需要理由——AI下棋只靠机制产生 人类常以「这手是○目」丶「这手是○○目」为理由来着手,但是AI从来不作这样的计算,和死活同样,AI的道理只有一个——因为这样下比较容易赢。 拿死活来比喻现实生活的话,是「生命安全」,而大小则可以说是「劳动代价」。没有救生索,又不知时薪多少的话,谁也不会去做打扫大厦窗户的工作。就像我们平时最在乎安全跟薪资一般,下棋的人是以死活与大小问题为中心在下棋。 死活与大小可以说是围棋最基本的单字与文法,而电脑围棋却无法认知,我一直认为这是围棋AI最大的弱点,当然也是最需改善的罩门。 AlphaGo在跟李世乭之战前,公开的棋谱的综合能力,的确非常厉害,但若还在用蒙地卡罗法的话,局部认识的机能的弱点是无法解消的,一百万美元的奖金不用说是李世乭的吧!无法辨认死活及大小,怎麽可能赢李世乭呢?我的棋士生涯,让我只能作这样的判断。 形势判断的重要性远大於「算棋」 就如前面所介绍的一样,结果深层学习带着AlphaGo飞越人类的头顶。 围棋比想像的还要宽广,AlphaGo拥有游刃有馀的计算能力,棋盘广大到让它即使怀着缺陷,却依然能悠悠踏步,有转圜馀地,回避自己的缺陷。 Master看来对算棋更有信心,棋风比AlphaGo更为强悍,AlphaGo尽量不去踩自己的弱点而造成陷阱;Master对付自己的弱点,像是随便踢开脚边的小石头,一点都不会令人担心。 原来下棋必须要有「死活」与「大小」的概念,这个前提是错误的;「死活」与「大小」若是人类下棋的语言,如果能「以心传心」的话,就不需要多说话;我终於想通了,围棋AI并非无法认识「死活」与「大小」,而是没有必要用局部的概念去认识而已! 图十三:Master持白棋,对於黑1,白棋放着右上七子不管,2丶4丶6埋着头连下上边,接着8丶10低位渡过,对黑棋也不是具有威胁性的手段,黑11罩,白七子被吃了,但从结果而言,形势其实白棋并不坏,这虽不能说是到了惊异的判断程度,但要是我,因为无法正确地算出大小,也就无法这麽简单地舍弃这七子。 经过长期深层学习训练後,累积三千万局数据收集对局(现在说不定又多好几倍)与无数自我对战学习的经验,作每秒一百万局的高度模拟;当电脑拥有这样的能力时,把棋盘当作一个整体来处理,其实正是非常符合围棋的本质的方法。 人类因为无法这样处理,只能就解析「局部」得到的资讯,再根据这些资讯来作综合判断,除此之外别无其他方法。今後围棋AI下的棋,对人类而言,虽然非常具有参考价值,但人类遭遇未知局面时,必须对於各个「局部」赋予意义後,再作全体的判断,人类的这种思考倾向是无从改变的。 以人类可能达到的围棋水平而言,AI的表现告诉我们,比起堆积意义的「算棋」,无从捉摸的「形势判断」是重要太多了,而从棋盘全体直接判断形势,正好成了AI的最强项,其正确性与速度,把人类远远抛在後面。 就像有人相信世界是以有理数(算棋)来构筑的,但後来发现丶有理数不过是浮在无理数(形势判断)之海上的藻屑而已,而人类终究无法测量海有多深,只能对着眼前的藻屑望洋兴叹。 Read more…

 2,809 total views,  6 views today

大橋拓文六段:運用AWS探求下一手的日本棋手

文章來源:找借口安靜 原址:https://blog.aboutamazon.jp/empowerment_as90_hirofumi_ohashi 原题:AWSがサポートする囲碁AIと棋士の挑戦——AIとアマゾン ウェブ サービスを駆使し、次の一手を探るプロ棋士たち 摘自:Amazon Japan 嘉賓:大橋拓文 六段 翻譯和整理:找借口安靜 Yes。 I know。 AI已經不是「人類的敵人」,而是作為學習工具,成為「人類的優秀夥伴」。——大橋拓文六段 2019年的日本圍棋,年輕棋手的出現讓人眼前一亮。以20歲的年齡,奪得史上最年輕「名人」和「王座」頭銜的芝野虎丸二冠。首位在「龍星戰」上奪得亞軍的女棋手,並且手握女流棋聖和女流本因坊的上野愛笑美女流二冠的表現被報道了出來。 「積極雲硬盤圍棋AI的年輕棋手,都在逐步提升實力」。對圍棋AI具有話語權的大橋拓文六段六段這樣說道。而大橋拓文六段也在使用AWS(Amazon Web Service),可以說是利用AI對圍棋進行研究的先驅者。「圍棋AI的實力可以說已經超過了人類,從之前的『對手』,變成了如今的『不錯的學習工具』。而日本棋手們運用AWS,使得圍棋AI成為更加親近的存在」。   大橋拓文4歲學棋,當時是受到父親的影響。而他的父親在退休之後,開辦了一家圍棋教室。小時候大橋拓文就開始過關斬將,初中時下決心成為職業棋手。2002年,17歲的時候成為了職業棋手。而這段時期,圍棋界也逐步開始進入數字化工具的時代。 「我在讀初中的時候,在電腦公司上班的父親給我買了『棋譜軟件』。在對局之後,把雙方的對局後的棋譜記在紙上,然後在記在這個軟件上面,最後再打印出來寄給我的老師。不過在當時看來自己有點匠人氣質,一度還出現了一些問題」,大橋拓文笑著說道,「我當時正處於是數字化和模擬信號的時代,所以感覺我比其他人更早地接觸數字產品吧」。 大橋拓文對圍棋AI感興趣,還是在AI萌芽期的2010年,當時還被稱為是「電腦圍棋」,多次前往對其研究深刻的電氣通信大學,認識了很多圍棋AI的開發者。圍棋縱橫19路,在19路盤的交叉點上放置黑棋和白棋,然後佔領地盤的遊戲。但是圍棋棋盤較大,各種各樣的變化使得形勢判斷變得非常困難。在很長一段時間裡,即便是AI,也覺得很難輕鬆超過人類。   「我在當時也沒想到,現在的圍棋AI能急速成長到這種程度。當時還覺得『超過人類還要再等30年,圍棋AI就作為我老年生活的愛好就行了』」。 但是在2016年3月迎來了轉機。圍棋AI擊敗了當時的世界頂尖棋手李世石九段。圍棋AI竟能如此快的超越人類,成為了圍棋界的大新聞。這是因為深度學習技術的引入,此後對該技術的深入研究,圍棋AI就此取得飛躍般的進步。而李世石九段在去年,留下「贏不了AI」之後選擇退役。而早早地開始研究圍棋AI的大橋拓文六段,卻多了不少AI的世界大賽解說,AI的演講以及寫稿等工作。2017年,出版了《易懂的圍棋AI大全「“よくわかる圍碁AI大全」》(日本棋院出版)。 隨著圍棋AI的發展,逐步開始進入圍棋AI可以安裝到個人電腦的環境。而大橋拓文在2018年7月,將圍棋AI安裝在自己的電腦中。「但是圍棋AI需要有圖片處理功能的電腦,而這個功能需要花大量電力,很遺憾剛剛租進去不久的家,安培數不足以支撐該電量。但是正好在這個時候,通過熟人向我介紹了亞馬遜的AWS雲端,說這樣就可以在筆記本電腦上使用圍棋AI,於是自己就引入了AWS」。   剛開始用AWS的時候,因為對很多設置都不清楚,於是在2018年10月,得知利用AWS的企業家和開發者的「AWS Loft Tokyo」公開化,於是就經常前往於此。「與其一個小白在操作AWS」,不如直接到「Ask An Expert」去詢問那裡的工程師。到了那邊,才知道很多我認識的圍棋AI開發者也去過那裡。現在他們在編代碼的時候,在旁邊開著圍棋AI,有時候也會教我不會的東西。一同運用AWS的人能一起交流確實非常不錯,現在我每週會到那邊2次左右。」 大橋拓文在學會了AWS的使用方法之後,開始介紹給了周圍的棋手們。從大橋拓文開始,很多學會AWS基本操作的棋手們,也開始分享給其他棋手,而上野愛笑美為了讓AWS更加使用方便,自己製作了操作手冊發給棋手們。現在很多棋手都可以輕鬆運用AWS使用圍棋AI。   「職業棋手每個月會有2到3盤正式比賽,其他時間基本上都花在研究圍棋上面,現在圍棋AI成為了不可缺少的存在。我每天會花4到5個小時在這上面,用的多的棋手一天甚至會用10個小時AI」。 圍棋AI會顯示當前局面的形勢判斷的勝率,以及表示可能會下出來的下一手棋的勝率。對此職業棋手們在局後將自己和對手的手段的好壞進行研究,或者利用勝率考慮最新的佈局。只要有網絡,在世界上的任何地方都能利用AWS,這也是AWS的一大好處。 「現在因為自己的對局,圍棋的普及活動以及世界性的圍棋AI大賽等,多了很多出國的機會,因為AWS的存在,讓我在國外也能輕鬆使用圍棋AI,非常方便。如果沒有用AWS,在自家電腦使用圍棋AI的話,很擔心自己的電費以及網絡連接狀態,可能就用不上了」。 在棋手當中,也邀請大橋拓文,開辦了定期的研究會「AI程序會」,上野愛笑美二冠等棋手也參與其中。「現在研究會有30人左右,研究會裡面還有70後的棋手,主要是10到30歲的棋手。圍棋AI不僅在日本,在中國和韓國,美國以及比利時等國也在開發,各自的AI都有各自的風格。有時候我們會開好幾個AI,然後進行比較,進行討論。大家在一起研究的話,就能看到通常很難意識到的手段。我們剛使用圍棋AI不到2年,但是年輕棋手們都用得非常熟練了。我覺得AI已經不是『人類的敵人』,而是作為學習工具,成為『人類的優秀夥伴』。」。   現在日本圍棋約有400名職業棋手,業餘棋手也有上百萬人,而世界上有幾千萬人樂在棋中,「希望圍棋AI,能讓圍棋變得更加大眾化」,大橋拓文這樣認為,「如果用了AI,每一盤棋就像棒球,像足球一樣,對局中的優劣情況都能用數字進行表示,這樣看棋的人就可以更加享受看棋的過程,當然我們還覺得,這樣一來圍棋的神秘力量就有可能會被淡化一些。」。 但是,圍棋的深淵以及神秘的世界,即便圍棋AI超越了人類,其實還有很多東西是未解之謎。 「對『圍棋之神』來說,圍棋AI或許還是赤子階段。幾年前,有證明說圍棋可以演變的局面數有172位數之多。現在的圍棋AI的學習程度感覺還在幾十億或者幾百億的程度,感覺才10位數到11位數的樣子。對AI來說,這個數量還沒到1%。而我們人類也有學習能力,我們也有可以變強的機會,相信今後的圍棋界會變得更加有意思」。  579 total views,  2 views today

 579 total views,  2 views today

柯洁再谈人机大战:下不过AI不影响我是人类第一

《君品谈》第一期华少对话柯洁与古力 柯洁与古力做客访谈类节目《君品谈》第一期,主持人华少与两位棋手畅聊柯洁与人工智能的比赛。 华少对话柯洁与古力 五年前,AlphaGo横空出世,颠覆了人们对於人工智能的认识。2016年3月,李世石与AlghaGo的比赛让柯洁大为震撼。「我觉得这是我活这麽多年最震惊的一件事情。我们之前不知道AlphaGo人工智能这个东西,我们还乐观估计人工智能想超越围棋起码20年以上。当时我们如果嘲笑一个棋手水平差的话,就会说你下的和电脑一样。但是现在这种说法好像是无上的荣耀了。」 柯洁微博 : 在李世石以1:4的比分负於AlghaGo後,柯洁在微博上的一句话,让他的粉丝一夜之间从一万涨到了25万。「就算AlghaGo战胜了李世石,但它赢不了我。」 高调的言论让他再次成为人们的焦点,人们不禁质疑难道他不怕打脸麽? 柯洁回想当时的情况後表示:「我就是死鸭子嘴硬!」 他觉得那时候的自己幼稚且中二,「当时是对人工智能很抵触也很抗拒的,觉得人工智能能战胜人类的话,人类就真的没有什麽下棋的必要了,也没什麽价值了。」 明知自己赢面的几率并不大的情况下,柯洁还是想挑战一次,想看看它到底有多强。大家也想期待能看看「人类第一」和人工智能的差距有多大。对於柯洁当时的心态,古力认为「面对这个时候我们想做一夫当关万夫莫开的那种角色,来顶住所有的压力,拯救世界。但是只是後面结果大家都知道,可能敌军过於强大了。」 当华少问到在连输两盘的情况下第三盘为什麽没有认输的问题时,柯洁回答道:「我没有想过要认输,因为还有一次机会,总归要下完。这是最基本的职业道德。後来虽然杀哭了很伤心,但是还是把棋给下完了。逃跑是从来没考虑过的,顶多是(输的)很难看。我就算输了,也不影响我在人类的第一名。」 柯洁 一张比赛中柯洁痛哭的照片在赛後被疯传於网络。对於痛哭的原因,柯洁表示因为当时自己觉得这辈子都不能战胜人工智能了,而且输得很难看。古力补充道:「不是有首歌叫《男人哭吧不是罪》,我觉得压力一下就全部释放了。当感受到压力的时候,哭是一种最快的释放压力的方法。」 柯洁面对这张照片有些激动:「其实後来我很後悔在那里哭出来了。因为我发现学校里用人工智能的图片时,硬要配上我这张痛哭的照片。他们会用这张照片去对比,人类怎麽样,人工智能怎麽样。」 这些不经意地表达其实也传递了柯洁内心的看法。这位97年出生的九段棋手因为没能管理好自己的表情,让媒体抓到他狼狈的一面而懊恼。赛後很多网友到他赛前的微博去留言,「脸疼麽?」「结果成了个笑话」。「哟,当时李和AlghaGo下的时候你那嚣张劲儿哪儿去了?」这条王思聪的评论更是把柯洁送上了热搜。关於网上的评论,柯洁则认为「我真的看得很开,其实这些言论我并没有很关心。我的想法未必要得到你的认同,要按照你的人生规划去做这些事情,我有自己的想法。我们训练的时候经常是一个人,我们也经常会自己一个人在独立思考或者说反思和复盘,不仅是围棋,包括任何一些事情。我一点都不在意其他的那些人。」 凤凰新闻  – 君品谈  216 total views,  3 views today

 216 total views,  3 views today