李喆：阿爾法讓4子不代表能讓我們2子 - 圍棋

Daniel · 2016-03-27

Table of Contents

Post
Comments
Related Posts

李喆：阿爾法新老版本讓4子不代表能讓我們2子

新浪體育訊　　田淵棟博士隨後趕赴機場。沙龍下半場由李喆和劉知青主講。李喆介紹了
人機大戰中的幾手棋。關於第二局37手的五路肩沖，棋手一開始都感到很意外。人下棋的
思維也會有剪枝的過程，五路肩沖通常是被剪掉的選點。對這步棋的優劣雖然仍存在爭議
，但高手們能夠理解這步棋，起碼拓寬了我們的思路。

　　第四局左下23手碰角也很意外，棋手可能會認為是俗手，是虧損的劫財，在腦海裡固
化的經驗會把它率先排除掉。但通過研究我們發現這步在這個全域的特定局面下是很可
行的。AlphaGo的絕大部分著法都和職業高手的感覺差不多，但還有一些走法找到了棋手
剪枝錯過的有效資訊。

　　劉星：我們在回顧關於第二局37手肩沖時，彭荃和孟泰齡的意見也相反，每個人都會
有自己的看法。柯潔與樸廷桓最近的網棋開局也複盤了這局棋，但沒有選擇這步肩沖，最
後輸掉了比賽。AlphaGo有很多超出了我們想法的招，感覺電腦是基於迅速定型的想法，
而職業棋手更習慣於保留變化，認為這樣是一種藝術。

　　李喆：確實，傾向於定型是AlphaGo演算法導致的，因為定型對於它而言對方是有概
率犯錯的。AlphaGo在特定局面下的選點，能幫我們打開思路。尤其是佈局上，AlphaGo
的很多招不一定是最優解，但它下出的超出經驗的棋能幫我們大幅進步。本身十九路圍棋
也不是僅有一個最優解，它的最優解是一個集合，很多局面下存在不只一個最優選點。

　　由小川：如果能拿到AlphaGo，在任何局面下可以繼續拆解，或許就能更好理解這個
選點的用意了。

　　劉知青：AlphaGo基本上每步棋都會有大致28手後續變化，進行進一步搜索，內部資
料會看到他的各種選點的。

　　李喆：關於第四局李世石78神之一手，雖然對於職業棋手而言可能並不能奏效，但卻
擊中了AlphaGo的弱點。這步棋起碼滿足了兩個條件：一是下出了AlphaGo認為萬分之一可
能性的落點，二是增加了有效變化與複雜度，這兩點滿足一點很容易，但同時滿足已經非
常困難，而且這步還蘊涵了打劫的變化。李世石這一步不愧被稱為“神之一手”，在對人
的時候或許還算不上，但對AlphaGo時這是體現人類靈性的一手，導致電腦出現了失誤。
AlphaGo 本質上是一個工具，對棋手來說可以提供一些新的認識。人機對弈之前，我們認
為創造力是人獨有的，機器沒有。但AlphaGo的幾步棋，讓我們驚歎它的“創造力”。棋
盤上的創造力就是下出超出經驗卻有效的棋，這是吳清源大師最擅長的領域。當然，
AlphaGo的“創造力”只是資料處理的結果，“創造力”只是我們人類的理解方式，AI本
身是與創造力無關的。類似的，AI作詩，如果我們不知道作者是機器，也可能從詩中讀出
情感，產生與作者的精神共通。作品的情感和價值究竟是作者還是讀者賦予的呢？這在
美學上同樣是值得反思的，其本質是認識論的問題。

　　邵煒剛：任何東西都是自身有感覺才會有共通的，比如尖沖那步，本是我們思索排除
掉的，但機器並沒有排除，就下出來了。

　　李喆：去年我做7路盤最優解的近似窮舉計算，不需要任何概念，我們也能夠算出最
優解。但在十九路棋盤，我們下棋用到了很多概念和道理。比如基本術語的抽象，比如輕
重、緩急、厚薄、虛實等等二元概念的抽象，比如在此基礎上對策略的抽象，典型如圍棋
十訣。圍棋可以很好地訓練這些思維方式，通過勝負和複盤來發現道理中正確和錯誤的
地方，這是圍棋中比最優解更高的價值所在。而電腦下棋則是在處理複雜的數學題，
AlphaGo的招是大資料處理、歸納的結果，而我們則是用道理的方式來接收理解，並且用
了很多演繹的方法。這些理解的方式可以在圍棋之外的很多場合都能用到，這種道理的普
遍性是人類思維方式的優越所在，也是我們之所以能說“棋如人生”的原因所在。把人
類思維的尊嚴寄託在單純計算的效用上，才會誤認為這次人機對弈是人類思維被機器擊敗
，並且不能接受，產生抵觸情緒。AlphaGo本身具有很強的工具屬性，它接收和回饋資料
，説明我們提升棋力以接近圍棋真理，又能在認知論和方法論上提供重要幫助。
關於第四局劣勢下的那些低級下法，是AlphaGo的演算法在劣勢下的一種選擇，蒙特卡洛
演算法使它會認為雖然對方大概率會跟著應，卻總還有不應的可能，即使對方應了，也只
是虧一點點，這點虧損去博對方不應的概率很划算。這也是我們經常看到AlphaGo在沒讀
秒時會選擇“打將”的主要原因。當然，人類的邏輯會告訴我們這是必然會應的，“僥倖
心理”沒有意義，但AlphaGo存在或然性。新老版本的AlphaGo之間能讓4子，但我們不相
信AlphaGo能讓我們兩子。這可能跟AlphaGo下受讓子對局時著法會變弱有關，因為初始勝
率高了。另一方面讓子的AlphaGo則發揮出極限能力。當然，我們希望看到棋譜，才能知
道究竟是怎麼讓四子抗衡的。

　　邵煒剛：AlphaGo只是超越了圍棋的競技屬性，但圍棋還有很多其他屬性。比如老友
之間手談一局，就比和電腦下棋愉快很多。

　　喆理圍棋沙龍由李喆六段發起，清華圍棋文化交流與研究基金主辦。旨在以沙龍的形
式，吸引志同道合的朋友，從文化、哲學等方面出發，共同思考、交流意見，探尋圍棋的
價值與本質。

　　希望參與討論、投稿或參與沙龍延展專案請發郵件至[email protected]，期待您的參
與！

http://sports.sina.com.cn/go/2016-03-27/doc-ifxqswxk9694900.shtml

--

圍棋