李喆:阿爾法讓4子 不代表能讓我們2子 - 圍棋

Daniel avatar
By Daniel
at 2016-03-27T14:04

Table of Contents

李喆:阿爾法新老版本讓4子 不代表能讓我們2子

新浪體育訊  田淵棟博士隨後趕赴機場。沙龍下半場由李喆和劉知青主講。李喆介紹了
人機大戰中的幾手棋。關於第二局37手的五路肩沖,棋手一開始都感到很意外。人下棋的
思維也會有剪枝的過程,五路肩沖通常是被剪掉的選點。對這步棋的優劣雖然仍存在爭議
,但高手們能夠理解這步棋,起碼拓寬了我們的思 路。

  第四局左下23手碰角也很意外,棋手可能會認為是俗手,是虧損的劫財,在腦海裡固
化的經驗會把它率先排除掉。但通過研究我們發現這步在這個全域 的特定局面下是很可
行的。AlphaGo的絕大部分著法都和職業高手的感覺差不多,但還有一些走法找到了棋手
剪枝錯過的有效資訊。

  劉星:我們在回顧關於第二局37手肩沖時,彭荃和孟泰齡的意見也相反,每個人都會
有自己的看法。柯潔與樸廷桓最近的網棋開局也複盤了這局棋,但沒有選擇這步肩沖,最
後輸掉了比賽。AlphaGo有很多超出了我們想法的招,感覺電腦是基於迅速定型的想法,
而職業棋手更習慣於保留變化,認為這樣是一種藝術。

  李喆:確實,傾向於定型是AlphaGo演算法導致的,因為定型對於它而言對方是有概
率犯錯的。AlphaGo在特定局面下的選點,能幫我們打開 思路。尤其是佈局上,AlphaGo
的很多招不一定是最優解,但它下出的超出經驗的棋能幫我們大幅進步。本身十九路圍棋
也不是僅有一個最優解,它的最優解 是一個集合,很多局面下存在不只一個最優選點。

  由小川:如果能拿到AlphaGo,在任何局面下可以繼續拆解,或許就能更好理解這個
選點的用意了。

  劉知青:AlphaGo基本上每步棋都會有大致28手後續變化,進行進一步搜索,內部資
料會看到他的各種選點的。

  李喆:關於第四局李世石78神之一手,雖然對於職業棋手而言可能並不能奏效,但卻
擊中了AlphaGo的弱點。這步棋起碼滿足了兩個條件:一是下出了AlphaGo認為萬分之一可
能性的落點,二是增加了有效變化與複雜度,這兩點滿足一點很容易,但同時滿足已經非
常困難,而且這步還蘊涵了打劫的變化。李世石這一步不愧被稱為“神之一手”,在對人
的時候或許還算不上,但對AlphaGo時這是體現人類靈性的一手,導致電腦出現了失誤。
AlphaGo 本質上是一個工具,對棋手來說可以提供一些新的認識。人機對弈之前,我們認
為創造力是人獨有的,機器沒有。但AlphaGo的幾步棋,讓我們驚歎它的“創 造力”。棋
盤上的創造力就是下出超出經驗卻有效的棋,這是吳清源大師最擅長的領域。當然,
AlphaGo的“創造力”只是資料處理的結果,“創造力”只是 我們人類的理解方式,AI本
身是與創造力無關的。類似的,AI作詩,如果我們不知道作者是機器,也可能從詩中讀出
情感,產生與作者的精神共通。作品的情感 和價值究竟是作者還是讀者賦予的呢?這在
美學上同樣是值得反思的,其本質是認識論的問題。

  邵煒剛:任何東西都是自身有感覺才會有共通的,比如尖沖那步,本是我們思索排除
掉的,但機器並沒有排除,就下出來了。

  李喆:去年我做7路盤最優解的近似窮舉計算,不需要任何概念,我們也能夠算出最
優解。但在十九路棋盤,我們下棋用到了很多概念和道理。比如基本術語的抽象,比如輕
重、緩急、厚薄、虛實等等二元概念的抽象,比如在此基礎上對策略的抽象,典型如圍棋
十訣。圍棋可以很好地訓練這些思維方式,通過勝負和 複盤來發現道理中正確和錯誤的
地方,這是圍棋中比最優解更高的價值所在。而電腦下棋則是在處理複雜的數學題,
AlphaGo的招是大資料處理、歸納的結果,而我們則是用道理的方式來接收理解,並且用
了很多演繹的方法。這些理解的方式可以在圍棋之外的很多場合都能用到,這種道理的普
遍性是人類思維方式的優 越所在,也是我們之所以能說“棋如人生”的原因所在。把人
類思維的尊嚴寄託在單純計算的效用上,才會誤認為這次人機對弈是人類思維被機器擊敗
,並且不能接受,產生抵觸情緒。AlphaGo本身具有很強的工具屬性,它接收和回饋資料
,説明我們提升棋力以接近圍棋真理,又能在認知論和方法論上提供重要幫助。
關於第四局劣勢下的那些低級下法,是AlphaGo的演算法在劣勢下的一種選擇,蒙特卡洛
演算法使它會認為雖然對方大概率會跟著應,卻總還有不應的可能,即使對方應了,也只
是虧一點點,這點虧損去博對方不應的概率很划算。這也是我們經常看到AlphaGo在沒讀
秒時會選擇“打將”的主要原因。當然,人類的邏輯會告訴我們這是必然會應的,“僥倖
心理”沒有意義,但AlphaGo存在或然性。新老版本的AlphaGo之間能讓4子,但我們不相
信AlphaGo能讓我們兩子。這可能跟AlphaGo下受讓子對局時著法會變弱有關,因為初始勝
率高了。另一方面讓子的AlphaGo則發揮出極限能力。當然,我們希望看到棋譜,才能知
道究竟是怎麼讓四子抗衡的。

  邵煒剛:AlphaGo只是超越了圍棋的競技屬性,但圍棋還有很多其他屬性。比如老友
之間手談一局,就比和電腦下棋愉快很多。

  喆理圍棋沙龍由李喆六段發起,清華圍棋文化交流與研究基金主辦。旨在以沙龍的形
式,吸引志同道合的朋友,從文化、哲學等方面出發,共同思考、交流意見,探尋圍棋的
價值與本質。

  希望參與討論、投稿或參與沙龍延展專案請發郵件至[email protected],期待您的參
與!

http://sports.sina.com.cn/go/2016-03-27/doc-ifxqswxk9694900.shtml

--
Tags: 圍棋

All Comments

Quanna avatar
By Quanna
at 2016-03-29T20:29
好文推,我一直都認為 圍棋趨近無限的變化,讓我們能
夠在其之上盡情發揮心性,才是他的價值
Steve avatar
By Steve
at 2016-03-31T21:04
只是 z尻大,你又這樣濫貼新聞,是不怕又被噓爆,驅離
捏?
Sarah avatar
By Sarah
at 2016-04-05T01:42
一天只能貼三篇呀
Caroline avatar
By Caroline
at 2016-04-06T17:36
哈 之前也在曼聯板看過你
Ophelia avatar
By Ophelia
at 2016-04-07T07:53
洗不膩

台灣圍棋教學有變熱門嗎?

Catherine avatar
By Catherine
at 2016-03-26T22:41
據哈薩比斯公佈的數據顯示,全球一共有2.8億觀眾收看了人機大戰直播,相關的報導文 章超過35000篇。圍棋棋盤的銷量,呈現超以往10餘倍的局面。對於人機大戰給圍棋項目 帶來的積極影響,哈薩比斯表達了美好願望,“希望這場人機大戰,能激發更多的人來參 與圍棋這項神秘的遊戲。” http://sports.qq.c ...

Deepmind :與李世石對戰的版本已有4500分

Connor avatar
By Connor
at 2016-03-26T21:23
Deepmind :與李世石對戰的版本已有4500分的實力 (柯潔3615分) https://goo.gl/Wm8CZU 圖: https://goo.gl/LSGHWk David Silver 昨天在UCL 給了個講座,其中提到對AlphaGo 的ELO 評分,其中跟李世石下 棋的版本(v18)竟 ...

第11屆春蘭杯首輪中國6人出戰全勝11人進1

Selena avatar
By Selena
at 2016-03-26T20:52
第11屆春蘭杯首輪中國6人出戰全勝11人進16強 春蘭盃:https://goo.gl/mWs8Nh 第11屆春蘭杯世界職業圍棋錦標賽第1輪在江蘇泰州賓館戰罷,焦點戰中國棋手羋昱廷擊敗 韓國新銳羅玄,四場中日大戰,中國棋手4比0橫掃。 首輪六位出戰的中國棋手全部獲勝, 算上古力柯潔等種子棋手,共有11位中 ...

李世石跟AlphaGo對戰時 其實沒發揮實力

Ida avatar
By Ida
at 2016-03-26T20:30
我不是說李世石放水 而是從最近的消息 AlphaGo 早就上網對戰練習 即使最近幾天都還有對戰紀錄 從對戰紀錄來看,AlphaGo沒想像的強 (不過最近的紀錄,我覺得可能在測試不同的玩法) 李世石可能緊張或知道對電腦有點受影響 如果不讓他知道是跟電腦對戰,我想成績會更好 所以李世石其實沒發揮應有 ...

AlphaGo 2014年 就開始上網對戰了

Ina avatar
By Ina
at 2016-03-26T17:47
※ 引述《SangoDragon (SANGO)》之銘言: : ※ [本文轉錄自 Gossiping 看板 #1MzYAsfy ] : 作者: SangoDragon (SANGO) 看板: Gossiping : 標題: [問卦] AlphaGo 2014年 就開始上網練習了 : 時間: Sat Mar 2 ...