電腦圍棋的發展與技術

2019/03/15  顏士淨 | 東華大學資訊工程系
近50年來電腦圍棋的發展可分為原始時代、 手工時代以及機器學習時代3階段, 在每個階段的演進及技術開發又如何呢?
在電腦圍棋四十多年的歷史中,研發人員前赴後繼,讓電腦圍棋棋力不斷向前推進,電腦圍棋的研究才正要進入一個新的世代。(圖片來源:種子發)

在電腦圍棋四十多年的歷史中,研發人員前赴後繼,讓電腦圍棋棋力不斷向前推進,電腦圍棋的研究才正要進入一個新的世代。(圖片來源:種子發)

電腦圍棋自Zobrist在1970年設計出第1個可與人對奕的程式以來,至今已有近50年的歷史。這幾十年來電腦圍棋的發展,可分為原始時代(1970~1985)、手工時代(1986~2006)和機器學習時代(2007~)。以下就從這3個時代來了解電腦圍棋的演進,以及每個階段的開發方法。

原始時代

Shannon於1950年提出利用電腦來下西洋棋的概念,之後電腦對局就成為人工智慧領域中吸引人的課題之一。早先的圍棋程式棋力約在35~25級左右,因為運用在西洋棋、象棋的那一套窮舉搜尋演算法完全不適用於圍棋。窮舉搜尋就是找出當下局面所有可走的棋步,並且嘗試走走看,然後電腦再反過來替對手找出所有可走的棋步,也嘗試走走看。如此一來一往模擬數個回合之後,電腦程式再根據所走出的局面優劣程度,反推最初的最佳著手。

為何這套演算法不適用於圍棋程式?原因之一是圍棋棋盤比象棋大得多,可選擇著點平均就有二百多個,電腦的負荷量太大了。更關鍵的是,圍棋不像象棋那樣容易迅速地評估優劣。

象棋或西洋棋都是以「擒王」這個明確的目標作為獲勝條件,其他棋子不論偏重攻擊或防守或攻防兼備都有其大致上的價值,只要把盤面上雙方存在的棋子價值加總,然後雙方做個對比就可以得知一個局面的優劣程度。透過這樣的方法,電腦就能夠非常迅速地計算出局面的大致優劣程度。

然而圍棋每個棋子都是等價的,判斷優劣所依靠的是棋子排列的陣形。雖然決定圍棋勝負的是圍取地域的多寡,但在這當中包含了太多諸如死活、厚勢、味道、地域確定性等不確定的因素,因此一個圍棋盤面很難找到迅速有效的方法判斷局勢優劣。

若事先把左圖建立為一個棋形,並指出白A長是好點,碰到如右圖的類似局面時,電腦就能看出白A長是好棋。

若事先把左圖建立為一個棋形,並指出白A長是好點,碰到如右圖的類似局面時,電腦就能看出白A長是好棋。

手工時代

這個時代圍棋程式的棋力有明顯提升,主要因素之一是應氏杯(1984~2000)的成立。應氏杯主要由應昌棋圍棋教育基金會支持,是第一個全世界性的電腦圍棋比賽。這個比賽提供了一個舞台,在這個舞台上的程式約以每年進步1級的速度發展。

代表性的程式有臺灣大學資工系的Friday、Dragon、Stone、Archmagic,與筆者的Jimmy。其他程式包括大陸陳志行的「手談」,美國陳克訓的GoIntellect,英國Michael Reiss的Go4++,美國David Fotland的Many Faces of Go,以及德國Mark Boon的Goliath。這個時期的程式棋力約在23~2級左右。這時的程式大多利用一些技術輔助選點下棋,例如在布局階段輸入定石資料庫,以及利用人造棋型資料庫協助找出好點。

除了棋型資料庫外,最常使用的技術是攻殺搜尋。這是一種由追殺某個棋串以及防禦該棋串這兩種副程序互相循環呼叫,最後檢驗能否吃掉該棋串的技術。

儘管使用了這些技術,但要讓圍棋程式接近業餘高手的程度仍有很大的距離。例如,攻殺搜尋時發現某個棋串可以吃掉,可是要判斷這個棋串是否是要子?吃這個棋串的價值高低?棋型的分數如何給定?就需要更高層的分析技術與專業知識。鄭銘煌的程式「若葉」就用到大量專家知識,幾乎不需要搜尋就可以下出不錯的棋步。因此,在1998年左右,是日本最暢銷的圍棋軟體。

廣州中山大學退休教授陳志行研發的「手談」,可說是手工時代的代表程式。「手談」擅長分斷對方棋子展開攻勢,且對於死活頗有獨到之處,也建立了相當專業的知識庫。無論在定石、棋形、局部手段、攻殺細算,不少地方都可以看出出類拔萃之處,以致「手談」自出賽以來(1993~2005)奪冠無數,無論應氏杯、FOST杯、Olympiad杯都連連告捷,成為當時公認的最強圍棋程式。

機器學習時代 

電腦圍棋的棋力之所以長期落後給人類,最大的原因是不容易找到良好的審局函數。直到2006年,Rémi Coulom使用蒙地卡羅法程式的Crazy Stone,才在杜林舉行的第11屆電腦奧林匹亞的九路圍棋項目中奪得金牌。2007年,蒙地卡羅法結合上界信賴樹狀搜尋法,合稱蒙地卡羅樹搜尋(MCTS)的程式開始出現。

以MCTS為基礎的圍棋程式MoGo也逐漸在一些較非正式的比賽中嶄露頭角。2007年,第12屆電腦奧林匹亞於阿姆斯特丹舉行,上屆冠軍GNUGO、亞軍GO Intellect以及Crazy Stone等程式都參賽。MoGo在強敵環伺之下,以全勝戰績奪得了十九路圍棋項目的金牌,Crazy Stone拿到了第2名,GNUGO退居第3。這象徵現在使用的標準MCTS(即UCT人工智慧)的成功,也代表一個嶄新的局面即將到來。

MCTS是一種使用強化學習的方法,可以在實戰時利用自我對下模擬結果評估盤面,某種程度解決了之前所提到的圍棋不容易找到良好審局函數的問題,且可以充分利用機器的能力,使用的機器核心數越多,棋力就越強。之後更開始利用各種機器學習技術,學習如何找出當前盤面較好著手的機率分布,乃至於近幾年開始發展的深度學習直接評估盤面與產生著手,這些發展都充分運用了機器的能力。

2006年後,以蒙地卡羅法程式為基礎,開始發展的深度學習充分運用了機器的能力。(圖片來源:種子發)

2006年後,以蒙地卡羅法程式為基礎,開始發展的深度學習充分運用了機器的能力。(圖片來源:種子發)

機器學習時代又約可分為機器暴力搜尋、離線機器學習、加強模擬準確率、深度學習4個階段。

機器暴力搜尋階段 機器學習時代一開始由MoGo稱霸,MoGo的作者是Gelly Sylvain、王一早等人。後期由Olivier Teytaud負責研發,並且把這系統平行化,改寫至可以在500~1,000核的分散式系統機器上執行。這個程式是第一個使用MCTS為基礎的電腦程式,最早的版本在模擬階段是用專家知識撰寫模擬落子順序,並使用3×3的人造棋型。其後加入了強化學習改進模擬方法,加速收斂MCTS搜尋的結果,對於增加棋力可說是立竿見影。

MoGo建立了現代圍棋程式的典範。MCTS程式與以往圍棋程式的行為有很大差異,布局很差,可說是沒有布局,但擅長近距離接觸戰,也擅長收官,這可以說是所有以MCTS為基礎的圍棋程式共同的特性。局面優時,則下得極端保守,常常最後只贏半目,局面不佳時,則想盡辦法翻盤,甚至下出像在耍賴的棋。MCTS另外一個特性是棋力跟使用的計算資源成正比,給予越多的計算資源,棋力就越強。

MoGo在2008年開始與東華大學和臺南大學合作,開發MoGoTW版本,並在2013年九路圍棋比賽中擊敗職棋。

離線機器學習階段 Crazy Stone的作者Rémi Coulom提出特徵自動學習法,以監督學習的方式從棋譜自動學習棋型的權重。學到的棋型不僅可以用在加強模擬的準確性,也可以用在MCTS搜尋樹展開選點的優先順序。執行模擬棋局時,就分析每一個可能著手的特徵,得出其重要性的分數,並算出選擇這著手的機率,再依機率落子。

此外,MCTS搜尋樹展開選點時,可以採用漸進式展開的技術,減少搜尋樹的分支度。Crazy Stone先依著手機率排序,隨著模擬次數逐漸增多,再逐步開放子點以供選擇。這階段另外的程式還有Many Faces of Go、Aya等。

加強模擬準確率階段 除利用機器學習技巧幫助MCTS更有效率地展開搜尋外,MCTS的另一個重點是模擬準確率的加強。以往以機器自動學習加強模擬,但都遇到瓶頸,後來就漸漸走向以較複雜的策略來模擬。這方面做得最好的首推日本的Zen,其作者是Ojima Yoji與Hideki Kato。Ojima Yoji原本是日本很有名的遊戲設計師,2007年開始投入電腦圍棋。據說Yamato除每周出外採買糧食外,大部分時間足不出戶,所有精力都放在開發程式上。

Zen成功的主要原因是Yamato把專家知識非常有效率,幾近完美地放在模擬中。Zen的商業版本只要進行1千次模擬,就可以達到初段水準,1萬次模擬就可以接近四、五段,這是以往動輒需要千百萬次模擬的程式無法想像的。Zen從2009~2017年就是世界各比賽的常勝軍,與Crazy Stone兩個程式可說是瑜亮,兩者的商業版軟體也是最暢銷的。

深度學習階段 2008年就有把深度卷積類神經網路運用於圍棋的研究。2015年,多倫多大學與Google DeepMind成功地把預測率的正確性提升到55%,超越了以往其他機器學習方法的45%。到了2016年在日本UEC的比賽中,前八名有7隊都是以深度學習技術開發的,深度學習技術造成了電腦圍棋棋力的大躍進。

隨著機器軟硬體的進步,2016年,Google DeepMind的AlphaGo終於擊敗南韓棋王李世乭九段,震撼了全世界。AlphaGo主要以深度學習與MCTS的技術來開發,並以強化學習的方式提高棋力。AlphaGo可分為3部分:MCTS、策略網路與使用強化學習開發的價值網路。2017年底,AlphaZero更是以從零開始的強化學習方式,打造出一個可以完勝AlphaGo的圍棋程式,充分發揮了深度學習的能力。

深度學習技術可以把整理專家知識的過程自動化,更精準而有效地吸收專家知識。電腦圍棋技術到了這個階段,不只用在擊敗人類棋王,相關技術在廣泛應用之後,對人類社會帶來的影響會是許多技術與服務的提升。

目前,人類對圍棋的了解還是太少。著名的圍棋棋士吳清源就說過,圍棋實在太難,他自己對圍棋的了解還不及十分之一。在電腦圍棋四十多年的歷史中,研發人員前赴後繼,讓電腦圍棋棋力不斷向前推進,電腦圍棋的研究才正要進入一個新的世代。

63 total views, 2 views today

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例一

例一:老定式。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招一

AI变招一:白4刺,黑5粘,白6再飞,黑7再尖三三显然呆重,白8高拆棋形舒展。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招二

AI变招二:黑5尖三三,白棋可以根据情况回拆A、B或者C位。以后有机会可以D位逼住冲断。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例二

例二:老定式。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI修正一

AI的修正:白棋不做A位的二路扳粘,避免强化黑棋外势,是这一修正的关键点。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招一

AI变招一:黑5飞,依照白棋的走法再定下一步的应对,白6、8是一种方法。白8直接托,成为流行的”芈氏飞刀”的可能行很大(原先的文章有介绍,不再赘述)。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招二

AI变招二:黑9扳,白棋重视边空的下法。以后角上的补棋或者打吃等手段,都是官子了。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招三

AI变招三:黑11断,至白16长出,也很有趣,黑到底拔掉白8一子还是连回黑9一子,有些纠结。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI变招四

AI变招四:白14提子,白16点刺,黑17以后就要看双方的战斗力了。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例三

例三:当年流行的小飞定式,几乎已经淘汰。主要原因是AI认为白4这手棋不紧凑,黑5即使脱先,对黑棋也无严厉的攻击手段。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI修正版本

AI修正版本:白4、6连扳。现在这种走法成为定式。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例四

例四:当年的流行定式。AI认为A、B位的骚扰对黑棋外势影响很大。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI的修正版本

AI的修正版本:黑11爬过。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例五

例五:过去的基本定式。AI认为白4黑5都不是好棋。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI修正版本

AI修正版本:白4飞压,黑5冲断作战是正道。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI修正版本二

AI修正版本二:白4尖,黑5也要大飞,白6飞进角,黑7就满意。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例六

例六:定式没有黑15与白16的交换。AI认为白8托过不好,让黑棋获取了外势,黑15不必保留,走完脱先即可,黑好。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI修正版本

AI修正版本:白8至14强硬压出。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

例七

例七:老定式。AI黑11与白12太保守,应该再奔放一些。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI的修正版本一

AI的修正版本一:黑11、白12提高效率,黑13再压。

【一分钟围棋】看看AI对老定式的修正,可以更好地理解棋理

AI的修正版本二

AI的修正版本二:黑11补,白12至20的走法双方都可下。

AI的修正是对棋理认知的提高,其根基是强大的计算力,作为业余棋友爱好者,能理解更好,理解不了模仿即可。

摘自:头条 @维坊围棋联盟

145 total views, 8 views today

AlphaGo時代,我們需要什麼樣的圍棋老師?

來源:愛棋道(wwwiqidao)
自上篇文章《AlphaGo時代,我們還需要圍棋老師嗎?》完稿以來,我就一直在思考,既然我們的結論是:在學習圍棋的道路上,無論如何都需要好的老師來教導。那麼,在這樣一個信息越來越透明,各行業充分競爭的時代,我們需要什麼樣的圍棋老師呢?具備哪些素質的老師將被我們的客戶 —— 學生及家長認可,進而更好地工作生活下去呢?

前段時間,我讀了一本最近很火的書《未來簡史》。在看過這本書之後,說實話,我有些不寒而慄。作為一名圍棋老師,我很擔心自己會成為書中所講到的那些「無用之人」,而思考怎樣避免讓自己走入這樣的境地,則成了本文的一個引子。

在回答「我們需要什麼樣的圍棋老師?」這個問題之前,讓我們來倒推一下,當未來正以加速度向我們走來之時,什麼樣的圍棋老師會越來越難在行業內生存呢?對此,我的思考結論如下:

在我看來,以下三種類型的老師會在快則三五年,慢則七八年內逐漸失去家長的認可,進而離開這個行業:沒有正確教育價值觀的老師、不愛學習的老師、沒有職業自豪感的老師。這個趨勢,將不以個人的意志為轉移。

第一種類型

沒有正確教育價值觀的老師

由於目前的圍棋教育行業還沒有出現像好未來、新東方這樣的教育巨頭,故業內還沒有足夠有影響力的口號,可以約束從業者的價值觀。

在這樣的大背景下,大多數圍棋培訓機構的第一優先選擇是:先把錢賺到,再談其他(積極地盈利驅動)。而在此前提下,對於其所管理的老師進行教育價值觀的培訓,基本都不是其非常關心的業務點,甚至是最不關心的。

這樣的情況持續發展之後,會出現一個嚴重的行業問題,即大量的「試聽課第一」型機構開始湧現。這樣的機構會投入大量時間和精力研究學生家長的心理,把「推廣—— 電話邀約 —— 試聽課 —— 銷售跟單」這個流程做到極致。一旦家長有了付費意願,就盡量讓家長多付幾年學費,之後以不退費的方法來綁定客戶。

據我所知有少數家長曾經遇到這樣的經歷,付費之前,機構方是非常熱情的,會用各種語言來描繪自己的專業度,對孩子如何用心,理念多麼先進等等。一旦付費之後,不好意思,您就按照我們的教學進度慢慢地,慢慢地學習吧(至於有多慢,我以前寫過評論的文章)。我們保證您的孩子在上課的時候開開心心,禮品卡、貼畫一張也不會少,但是如果您課堂之外想和老師聊聊孩子的進步情況,未來的學習路徑,應該樹立什麼樣的目標,再或者是批改一下孩子的題目,給孩子下過的棋點評一下,對不起,老師太忙,真沒時間。至於你要退費,那就只能和你說一聲抱歉了,本店概不退費。

我可以肯定的說,在這樣的機構接受培訓,認可「試聽課第一」價值觀的老師,未來是無法在圍棋培訓行業生存的。總體而言,雖然圍棋的認知門檻較高,很多家長不懂專業知識,容易被「忽悠」而付費。

但是從社會進步的角度來看,隨著互聯網行業的深入發展,去中介化和行業透明度越來越高是不可阻擋的趨勢,沒有正確的價值觀,不願意用真心去服務孩子的老師,一定會是被行業邊緣化的。

教育行業總是要講口碑的,如果僅把銷售培訓當做重點,忽視對老師價值觀的培訓,那麼長期來看無論是機構還是老師,都很難贏得家長的認可。

之所以把價值觀放在第一位,也是受了好未來集團創始人張邦鑫老師的影響,他常說的一句話是「教不好孩子等於偷錢搶錢」。這句話,其實也就是核心價值觀的闡述。愛棋道的每一位老師,在入職之前,都必須要接受價值觀的培訓,我們用一個個案例,來告訴新加入的老師們該如何樹立「學生第一」的價值觀。

給學生服務不是一朝一夕的事情,只有具備了正確的價值觀,才可以在未來遇到困難和壓力的時候,不埋怨、不動搖。教育行業本身就是一個「重」行業,如果老師的價值觀不端正,很快就會因為承受不了壓力而離開的。

第二種類型

不愛學習的老師

樹立起了正確的價值觀之後,老師們還要有一顆愛學習的心,否則,在這樣一個快速進步的時代,你的能力遲早會拖你的後腿。能力這件事情,可不是完全可以依靠價值觀來彌補的,這個道理,就像我們不能做到僅僅靠意志去攀登珠穆朗瑪峰一樣。

老師們都要學習什麼樣的知識技能呢?

首先當然是自己的專業技術,自己的棋都下不過學生了,還好意思當人家的老師嗎?圍棋屬於一門很專業的課程,你自己不會下圍棋,給孩子上課之前現學現賣,肯定是不行的。一旦孩子或者家長問你幾個專業的問題,馬上就露餡了。
其次,老師要深刻學習並理解圍棋教育的路徑,也就是教學方法。學生在什麼水平階段,應該側重哪些技術點的學習,是一個老師必須要深諳於心的。(詳情請見我以前的文章 —— 如何高效的進步)。

我見過很多老師,在孩子初學的階段,就讓家長每天督促孩子打棋譜,背定式,一旦背不下來,就大聲斥責,這樣的老師,不能說不認真負責,但是由於對學習路徑的錯誤理解,導致力氣沒有用在正確的地方,這樣下去,就會出現老師越用心,孩子進步越慢的窘境。這種不專業的教學方法,也會讓老師漸漸失去家長的信任,進而離開。

需要說明的是,老師除了需要不斷學習圍棋本身的教育規律,還需要學習行業外的相關知識,如果你是一位不斷追求進步的老師,那麼類似於兒童心理學這樣的課程,也是非常值得你學習的。
第三,老師一定要與時俱進,熟練使用各種先進工具,例如愛棋道平台(www.iqidao.com)上的在線課堂、智能題庫等,如果還能利用好互聯網上的各種內容資源,那就真是無敵了。老師只有具備這樣的能力,才能進一步提高自己的工作效率,把有限的時間,用來服務更多的學生。如果一位老師價值觀很正,又很懂得教育方法論,但是就不願意去學習先進的互聯網工具,那麼,他自己再厲害,也只能服務十位數的學生,一旦學生上升到百位數,他就會勉為其難了。即便強撐下去,也會導致其教學技術的變形,進而帶來教學效果和口碑的下降。

「工欲善其事,必先利其器」。愛棋道的老師,都要接受互聯網工具的培訓,熟練使用包括愛棋道智能題庫在內的各種工具,是老師的必修課。「用科技推動教育進步」+「用科技推動教育公平」也是愛棋道的兩大使命。

第三種類型

沒有職業自豪感的老師

我見過有一種類型的老師,雖然在服務孩子的時候很有熱情,也具備相當的專業度,但是在他自己的內心中,並沒有覺得這是一件很神聖,很驕傲,值得自己終生去做的事情。

這樣的老師,往往會在教學的同時做著其他的事情,在他們心中,如果其他的事情可以帶來更高的收入,可能就會隨時離開這個行業了。

我不願意把這樣的行為歸類到價值觀的範疇,畢竟,想要賺取更高的收入是人之常情,但是客觀地說,如果沒有在這份工作中收穫職業自豪感和發自內心的成就感,這樣的老師,不會長久留在這個行業,也無法長久地得到學生和家長的認可。

真正優秀的老師,會在看到孩子成長的時候,有發自內心的開心,會在孩子比賽的時候,一顆心隨著局面的變化而跌宕起伏。會在孩子開心或者難過的時候,用自己的真心去提醒他不要驕傲,安慰他不用氣餒。

這件事,是需要內心的自豪感和榮譽感來驅動的。而這份投入,也和錢的多少沒有關係。

之所以把好的圍棋老師的高度提到這個層面,其實和我的人生經歷密切相關,我能夠有今天的水平和成績,與我所經歷的三位授業恩師不可分開,我在初學啟蒙時期遇到的邢印達老師,在即將陷入歧路之時遇到的徐榮新老師,還有在人生的關鍵時刻遇到的聶衛平老師,都是不計報酬,把教好我這個頑劣學生當做頭等大事的老師,沒有他們,不可能有我的今天。

在創辦愛棋道的時候,我的發心就是要做像他們一樣的老師,為我們的學生提供最好的,最正確的教學服務。「教真圍棋,讓每一個孩子得到圍棋的真正快樂」是我們的最高理想。

如果我們已經明確了什麼樣的老師在未來存在不被認可的風險,那麼,我們自然也就知道了,什麼樣的老師會在未來得到越來越好的行業地位,得到所有人的認可!

這篇文章已經接近尾聲,以上的文字,既希望能幫助家長們辨別好老師,也希望能讓正在從事圍棋教育的老師們,得到學習的方向指引。

182 total views, no views today

AI对AI:LeelaZero 对战 FB权重 – 第二局 获胜





LeelaZero最新203权重,对战FB权重获胜  – 第二盘。

 

409 total views, 4 views today

AI对AI:LeelaZero最新203权重,对战FB权重获胜





只有AI能战胜AI,LeelaZero最新203权重,对战FB权重获胜。

本次对战使用2080显示卡,FB权重在60s的时间限制之下,可以细算约5万步,每一步都有3~4段的水准。

与它对战的是LZ_203版的权重,虽然LZ的40 Block权重,早在去年11月就已经在同样的1600次细算之下,击败FB达到超过50%胜率,但是FB权重是20 Block的,运算速度是40 Block的两倍。

在相同时间的限制之下,FB权重有两倍的细算步数,对战40Block权重胜率仍然很高。

最近几版LZ 40 Block 的权重的实力持续成长,已经可以在相同时间下战胜FB。

本次对战的LZ_203权重是40 Block,大约只细算2.5万步。

电脑的权重,可以理解为[棋理],电脑会根据权重去做细算,不同的权重会有不同的细算结果。

20 Block 与 40 Block 是神经网路的大小,庞大的神经网路可以容纳更多讯息,小的神经网路有较高运算速度。

173 total views, 2 views today

人工智能新定式 – 小目-小飞挂-二间高夹-飞压的定式

基本图:这是小目-小飞挂-二间高夹-飞压的定式

黑棋冲断后,AI为大家提供了全新的下法。

图一:白棋直接挡下,意外地有力。黑棋2,4扳粘后,白5打,7跳紧凑,意图将两边都处理妥当。那么,接下来黑棋应该如何进行呢?

图二:首先,连压的粗俗下法不可取,黑棋先在右边付出巨大代价后,在上边仍然无法很有效地攻击白棋三子,白棋拆一后棋形弹性十足,如此黑不行。

图三:我们再来看黑1挡住的下法。白2立后,于4,6托断是白棋主动的战斗,由于始终有白18位跳枷的手段,黑棋颇受牵制,很难取得满意的定型。

图四:黑棋打吃再长也难以抵挡白10枷的手段。

图五:黑省略连压的交换,直接跳罩白棋是手筋,也是此处黑棋的有力手段。

图六:黑棋留给白棋的破绽其实是一个陷阱,白棋如贸然冲出,右边三子将自然死亡,如此白不行。

基本图:我们讲到黑棋的跳罩。

图七:白2小尖是有力的下法之一。对此,黑3靠住必然。接下来白4跳是不容错过的要点,黑5挤,白6虎,形状很有弹性,局部基本已经成活,将外围的难题留给了黑棋。现在黑棋外围有断点,角里又不活,此时黑当如何处理呢?

图八:黑1粘无谋,白2补棋后,黑外面弱点和角上弱点已经很难兼顾。

图九:黑3断如何呢?白4简单出头即可,黑5夹攻时,白棋冷静整形,外面已经是白棋不怕的战斗,而且将来角上…

图十:黑棋不补角的话,将面对劫活的艰难处境。

图十一:黑棋直接冲击右边白棋如何呢?由于黑棋外围有明显裂隙,白棋简单地“七子延边”,也是立于不败之地。

图十二:其实仔细分析后我们发现,白棋补右边断点后,黑角就需补棋,那么黑棋外围已经很难一手补好。我们知道,走不好的地方先不走,往往都是非常有效的办法。没错,大胆脱先,是这个局部黑棋可行的方案!我们发现,黑棋脱先后,白棋却也没有一个直接拿住黑棋的方法,白1位尖是棋形,对此黑棋当继续脱先到底。右边断点依然存在的情况下,角里就不必急于补棋,外面黑子没有粘重的情况下,也可以暂时不予处理。

文章来源:弈客围棋 , 如有侵权敬请联络,我们负责删除相关信息。

823 total views, 10 views today

人工智能新定式 – 星位-一间夹-点角的定式

基本图:这是星位-一间夹-点角的定式。

进行到黑7,是我们再熟悉不过的进行,那么接下来AI给了我们怎样的建议呢?

图一:首先,8位单飞,令人耳目一新!

此手省略角上的扳粘,直接飞出,应该是意在保留白2一子的活力。虽然没有获得更多的目数,但是白2一子将来的动出变得更加现实且严厉。另外,白棋飞着出头,虽然比跳出的形状先低了一路,但是留给黑棋的借用也变少了很多。

图二:白8,10如果扳粘,黑11是定式改良的另一要点。相比粘,黑棋二路爬棋形更加完整,所剩下的断点,并不严厉,却补掉了二路夹的手段,可以说相比老定式得大于失。

文章来源:弈客围棋 , 如有侵权敬请联络,我们负责删除相关信息。

154 total views, 4 views today

与时俱进,常见AI定式一览

小目小飞挂

黑飞起常见,白可选AB或脱先

图二 

白若高挂,托退定式,是少数未淘汰的人类定式

图三

黑3尖顶再跳,Ai定式

图四 黑小飞守角,白托了连扳

黑小飞守角,白托了连扳,是Ai认为的最佳局部应手

图五 – 变化1

此为常见棋形

图六 – 变化2

黑也可飞起,扩张外势

图七 – 变化3

黑1争先手

图八

白也可拆一

图九 – 星点33

星点33,现在最多的下法,这是基本图

图十 – 变化 1

黑11连板需要征子有利

图十一 变化 2

互提一子

图十二 – 变化 3

黑征子不利21飞

图十三  – 变化 4

白也可打吃一子

图十四 – 变化5

白托也可行,变化复杂

图十五 – 变化6

仅在此举一例

图十六 – 变化 7

黑长简明

图十七 – 变化 8

黑长简明

图十八  – 变化 9

黑也可再长,简明

图十九

白征子有利,才可2跳,黑9鼻顶手筋

摒弃以前学的各种定式吧,这个时代,尝试一下这些AI基本定式,是紧跟潮流必须做的

互联网收集文章 : 弈客围棋  ,如有侵权,敬请联络我们负责删除。

1,243 total views, 20 views today

围棋AI 缩短了职业与业余之间的距离

特约记者古柯报道 晚报杯职业与业余对抗是压轴戏,32年来,这个对抗持续进行,但双方的实力对比却发生了翻天覆地的变化。

最早的职业与业余对抗都是让两子,1988年首届晚报杯职业业余对抗,职业高手几乎倾巢而出,双方战成5比5,前三台聂卫平、陈祖德、马晓春皆负。业余棋手实力与名次颇为相称,前五台对阵职业顶尖,业余棋手4胜1负;后五台职业棋手实力稍逊,业余强豪则1胜4负。

第2至第3届晚报杯职业业余对抗没有举行,第4届职业对业余让两子,职业4比1胜;第5届更是6比0大胜,当时最强的职业棋手聂卫平、马晓春、刘小光、曹大元、俞斌、张文东悉数上阵,业余强豪一败涂地。

第6届业余强豪大打翻身仗,同为让两子,但5比1胜出。职业阵容三进三出,实力有所减弱也是事实。第7届职业高手聂、马、刘、曹一个不落,却还是与绿林军战成5比5。

第8届对抗,职业队复制第5届阵容,实力过于强大,业余强豪被让两子亦抵挡不住,1比5大败。仅有蜀中唯一的业余7段唐晓宏力取俞斌九段。

第9、第10、第11届连续三年职业与业余战成3比3平,这三届比赛过后,职业高手让业余强豪两子已勉为其难。最主要的原因是,冲段少年们开始出战,自小经过职业训练的他们实力要比传统业余强豪更为扎实。

1999年第12届晚报杯赛在昆明举行,北京老牌业余强豪孙宜国获得冠军。这也是老牌业余强豪最后一次在晚报杯赛中夺冠,标志着一个时代的结束。从此,晚报杯成为冲段少年和准职业的业余天王们平分天下的格局。

也从1999年晚报杯为标志开始,职业对业余让两子渐成历史。当年第12届职业VS业余对抗,职业1比5;第13、第14届晚报杯,职业高手2比4。在业余强豪中出现了古灵益、张东岳、赵哲伦等冲段少年的身影,他们不久成为职业棋手。

晚报杯职业让业余两子对抗的传统在经过了14个年头后,终于不得不修改对局格了。从广州举行的2002年第15届晚报杯开始,前三台让先,后三台让两子,一年一升降。第一次对抗赛“升格”,业余队5比1大胜,直接让下一届对抗改为职业让先。

2003年在汕头举行的第16届晚报杯职业业余对抗,史上第一次职业棋手全部让先,简直有逆天之感。但看看参赛的业余强豪有时越、古灵益等冲段少年就释然了,结果职业5比1胜出,挽回颜面。

之后双方对抗出现跷跷板模式,前三台让先、后三台让两子的话,业余棋手占优;全部让先,则职业棋手明显有利。这种平衡一直持续到2009年。

不过,在2010年海口第23届晚报杯对抗赛时,职业棋手即使前三台让先亦毫无优势,0比6大败。原因无它,业余六强几乎全是冲段少年,看看他们的名字:王琛、李梦石、卢天圣、李翔宇、高恬亮、夏晨琨。等于说是职业与准职业棋手之间进行的对抗,让两子简直天方夜谭。

2011年主办方别出心裁,派出6名一线职业女棋手与业余强豪进行分先对抗,结果女棋手1比5大败,令人对女棋手的实力大为惊讶。后来主办方也觉得无趣,自此再未举办过类似的对抗。

终于,从2012年起,职业与业余对抗的对局格全部改为让先,职业棋手仅仅于2012年和2014年2比4落败,其余皆胜。2017年晚报杯30周年纪念活动,职业与业余10对10对抗,对局格一概让先,由时越、陈耀烨、唐韦星率领的强大职业队10比0大胜,此结果多少也有点意外。

2018年晚报杯第二次在昆明举行,主办方别出心裁地将职业、业余对抗安排在游船上进行,对局格依然为职业让先,结果业余六强2比4落败,较之于2017年,挽回些颜面。

2019年拉萨净土第32届晚报杯在拉萨举行,晚报杯第一次上雪域高原,对所有参赛的业余强豪都是一大挑战。结果,身体调整得最好的王琛7段终结了奇怪的“四连亚”,第二次登顶,分别获得第2至第6名的是于清泉6段、瞿鸣6段、赵炎6段、花畅6段、赵斐6段。业余天王中的另三位胡煜清8段、白宝祥8段、马天放7段分别获得第7、第14、第63名。

前六名清一色都是年轻的业余天王棋手,年龄最大的是王琛,27岁;年龄最小的瞿鸣仅有14岁。老牌业余天王、冲段少年以及退役的职业棋手均名落孙山。

压轴戏——职业VS业余对抗赛,出战的职业棋手分别是:谢尔豪九段、李轩豪七段、谢科七段、赵晨宇七段、孟泰龄六段、李维清六段。结果谢尔豪负王琛、李轩豪负赵斐、赵晨宇负瞿鸣、谢科胜于清泉、孟泰龄胜赵炎、李维清胜花畅。

近三年,职业业余对抗从10比0到4比2再到3比3,业余强豪们一年比一年进步,而对局格是让先,可见职业与业余的实力差距越来越小。其最主要原因是,围棋AI的问世。

职业高手们现在依靠腾讯绝艺进行训练,而立之年的陈耀烨九段还为此焕发第二春,在首届天府杯半决赛和决赛中连胜朴廷桓九段、申真谞九段这两位韩国排名前两位的棋手,掀起“倒春寒”;业余强豪们也没空着,他们无法获得绝艺进行训练,就在网上下载其他围棋AI进行训练。王琛用手机与家里的高配置电脑远程联网,每轮比赛过后即用围棋AI进行复盘研究,这已成为他的必修课。其他几位业余高手亦如此,围棋AI改变了他们的训练模式,而在过去,他们大多通过研究会的方式进行研讨,但现在,王琛他们只需要一台电脑甚至一部手机即可。

既然大家都在用围棋AI进行训练,而且业余天王们形同职业棋手,以围棋为职业,如果不是王琛他们的基本功稍逊于职业高手的话,双方迟早都要进入分先的对局格。

是围棋AI改变了围棋生态,拉近了职业与业余之间的距离。从此意义上说,职业女棋手与男棋手之间的差距也应该为之缩小,难道不应该吗?

文章摘自 野狐围棋

103 total views, no views today

围棋 AI 养成指南 | 回形针

2017 年 5 月 27 日,由谷歌开发的围棋 AI AlphaGo 以3:0 击败当时世界排名第一的围棋棋手柯洁,随后宣布退役。

虽然 AlphaGo隐退,但它的算法却启发了一大批围棋AI 的开发。而这些 AI 之间的交锋很快成了围棋领域新的焦点。

创立于 2007 年的UEC 杯世界电脑围棋大赛每年都会集结全世界最先进的围棋 AI ,在相当长的一段时间内,冠军都由法国的Crazy Stone 和日本的 Zen 轮流获得。

然而在 2017 年第 10 届比赛中,由腾讯团队开发的围棋 AI “绝艺”首次参赛就打败其他老牌劲旅,夺得冠军,一举展示了新算法的优越性。
围棋AI新算法为什么这么厉害?
通常来说,所有棋类游戏都可以展开成一棵“游戏树”,这棵“游戏树”包含了每一回合的所有可能局面。AI 要想获得胜利,最直接的办法就是“暴力搜索”,列举出所有可能的棋局,再从最终的胜局向前回溯到当前局面,选择获胜概率最大的走法。
但围棋可能的棋局数量是 10 的 170次方,远远超过已知宇宙中所有原子的数量(10 的 80 次方),如果用“暴力搜索”下围棋,还没等人工智能算完,对面的人类棋手就已老去。
所以为了提高下棋速度,首先要提高计算机的运算能力。但即便是2018 年世界上最快的超级计算机 Summit,每秒 20 亿亿次的浮点运算还是很难用“暴力搜索法”应对围棋的巨大变数。
要想在合理的时间内做出决策,必须优化程序的算法。
围棋 AI 算法的核心在于:蒙特卡洛树搜索以及人工神经网络。
蒙特卡洛树搜索的基本原理可以理解为,在“游戏树”中随机选择一条分支,并向下推演,如果这条分支的走法可以获胜,就赋予一定权重,并在下次随机选择时优先选择权重高的分支。当随机推演的次数越来越多,那些接近必胜的走法就会脱颖而出。
而人工神经网络包含策略网络(Policy Net)和价值网络(Value Net)。
通过人类棋谱以及自己左右互搏获取数据,前者可以找出规律并预测对手的下一步;
后者可以计算出不同决策的获胜概率。
配合人工神经网络,蒙特卡洛树搜索算法可以优先找到对手最可能走以及获胜概率较大的那些分支,在保证胜率的同时极大缩短了运算时间。
不过,要想开发出实力强劲的AI,只有算法还远远不够,不同的训练方法会让围棋AI 的实力相去甚远。
在这方面,“绝艺”的秘诀之一就是和人类棋手切磋。
2016 年 8 月,“绝艺”开始用野狐扫地僧、刑天、骊龙等马甲在对战平台“腾讯野狐围棋”上与一百多位顶尖棋手对弈上千局。
这些人类棋手的棋风各异,能让“绝艺”暴露其不足而得以不断优化。2016年“绝艺”的胜率还在上下波动,到 2017 年底就已经能稳居90% 以上。
此外,这还让“绝艺”成了圈内的网红。今天,绝艺的每一次在线对局都有超过上千的棋迷观赛。2017 年 8 月,“绝艺”更是发出了自己的第一条微博,开始与网友互动。于棋迷们而言,“绝艺”是天赋异禀的少年棋士,又因其与“野狐”的渊源,也被戏称为机智的“小狐狸”。
与此同时,其他围棋 AI 也走上了网红之路,比如来自比利时的Leela Zero 采用分布式计算,靠志愿者的电脑提供算力,通过开源收获了世界各地棋迷的宠爱。而来自美国的 ELF OpenGo 则致力于搭建人工智能游戏测试平台,让围棋 AI 的算法适配更多类型的游戏。
今天,人工智能已经开始改变人类对围棋的认知, 2018 年4月,“绝艺”成为中国国家围棋队训练专用AI。通过显示人类棋手每一步的胜率和变化图,更精确地判断出局势变化,摒弃了以往人类棋手依靠经验与直觉的笼统评价。
毫无疑问,人工智能的应用拓宽了人类对围棋的认知,而这种认知也将不断提高围棋AI 的实力。
于2018 年 6 月 23日开幕的,腾讯世界人工智能围棋大赛,集结了11 支国际顶尖的围棋 AI 队伍。在两天的预选赛中,各国AI上演了无数精彩对局,而“绝艺”也获得了七战七胜的骄人成绩,携LeeLa Zero、ELF OpenGo、星阵围棋等八位AI选手晋级复赛。
文章来源摘自网络: 回型针PaperClip   如有版权问题请联络我们,我们将负责删除相关文章。
#AI围棋 #绝艺 #LeelaZero #ELFOPENGO

222 total views, no views today