Re: 從象棋觀點看AlphaGO為什麼會輸 - 圍棋

James avatar
By James
at 2016-03-14T22:10

Table of Contents

其實寫得很好!
只是有些許地方我覺得有些疑問


: 會下出黑101的理由同上 電腦算不出分數更高的棋會傾向「維持現狀」...
: 奇怪了我怎麼突然覺得我的用詞有政治意味............XDDDDDDDDD

alphago會不會傾向於維持現狀,我不是非常了解。
主要疑惑點在於官子

http://i.imgur.com/siQwKgm.png
這是alphago在nature中提供的運算原理簡圖。
圖下有詳細說明。
大致上是說:
(a)系統會先選點,
予以最高行動值(action value)"Q"+u x 預先機率(Prior probability)"P"
找出最大者
(b)擴張
找分枝。
(c)演化後
(d)迴車
至初始點,修正機率。


換而言之,因為行動值的參與,所以與目數或點數相關。
因為有迴圈協助,機率不會完全參照當下情形,更重於未來發展。


: 最後來解釋一下末段AlphaGO官子崩壞的問題...
: 這個可能是AlphaGO以機率進行計算所產生的獨特問題
: 非常值得重視和研究!
: 因為對於人類而言 下到官子階段所判斷的單位是「子」或者是「目」
: 這和比賽勝負的計算單位是相同的 是一個絕對的值
: 比如同樣後手官子一個5目一個3目 那當然是5目的大 這是絕對的
: 可是 如果轉換成「勝率」概念 那就不一樣了!
: 「勝率」本質上是一個會隨著棋盤上子數變動的東西......
: 當棋盤上的子數越來越多 代表棋局越進入尾聲 勝率會越確定
: 反之棋局越早期 勝率會越變動...
: AlphaGO用勝率為單位做計算所面臨的問題是:
: 它沒有辦法真正有效區辨官子的大小
: 因為當它優勢的時候:贏5目也是贏 贏3目也是贏
: 劣勢 輸5目也是輸 輸3目也是輸

所以這個說法有些不太合理。
第一局的後半期白棋已非常優勢。而白棋也未放鬆。

http://i.imgur.com/4lV2dLt.png
倘若電腦白棋不知官子,為何下此處而不補左下角?

http://i.imgur.com/LHcxAqb.png

第三局,若電腦白棋不知官子,又如何知道96求先手後98檔?108點入後做活?

倘若原po說的沒錯,李世石下到後面豈不是都能半目負?

個人覺得不應該因為第四盤而小看電腦官子。
一般,根據過去電腦圍棋的經驗,官子一定是電腦最為擅長的。
畢竟排出先後手、比大小、分析死活後,一個演算法就能輕鬆排出最佳解。
這也是人腦官子的邏輯。

雖然alphago的演算法與過去不同,沒有詳細編碼能參考,
但也明顯未捨棄地域的參數。至於優劣就不清楚了。


: 這就是說用勝率計算的話
: 一個後手5目官子和一個後手3目官子對AlphaGO而言很可能都一樣!
: 因為改變不了比賽結局!
: 這樣一來在優勢的時候它很可能下鬆 不過還可以維持在安全運轉的範圍之內
: 因為它總是會選擇勝率大於50%的棋步......
: 但劣勢的情況下則可能變成像是完全隨機亂走!
: 因為官子不分大小看起來都是輸!通通都一樣!
: 這樣的話根本沒有辦法在劣勢情境下走出有效的抗衡手段 是非常嚴重的缺點!
: 我認為這個BUG的嚴重性可能會導致AlphaGO完全重寫
: 下一代的BetaGO(?)應該會重回以「子」或「目」作為基本計算單位的架構
: 然後再慢慢去養......
: 話說這個基本單位問題的取捨是很重大的議題
: 研究團隊應該有針對這個東西開發了幾個前期版本加以實驗才對...
: 我猜想以勝率為基本單位的優點
: 應該是在棋局前期根本無法換算出確定地的情況下 用勝率去判斷會比較靈敏?
: 無論如何這造就了一代佈局直覺狂勝人類的AlphaGO
: 衷心讚嘆Deepmind團隊對於棋藝的卓越貢獻!希望能繼續進步!

至於電腦的特點,相信各位經過幾天觀察也很清楚了。
電腦算機率,算可能性,畢竟是找出最適合夏法的直線型思考。

所以棋風硬直,輕巧處裡的不多。

對於打入的演算十分敏感

第一局的18,78, 102
第三局108
第四局的113

騰挪算是前中期極強的

第三局尤為出色

之所以稱為硬直是我的感覺,因為除了第三局的32算是極具輕靈色彩的好棋,其餘多數
,除了極愛尖衝外,都為硬碰硬的棋風。非常具有現代特色。

可偏偏許多鬼手妙手並不在機率之中。
https://www.youtube.com/watch?v=4JswWVN2NcQ
就看第五名(第一局)
這種一路死活相關的妙手在演算中就不可能出現。一沒地、二沒氣,正常算法都沒優勢。
更別說以前也沒什麼人下過,局勢也十分新穎。

電腦下的出才怪。

第四局的李世石妙手就是明證。

圍棋中也有很多時候,是十手、十幾手後有某個妙手,因此當下著法是惡手。

因此,圍繞著妙手惡手的設局,恐怕才是下贏電腦的關鍵。

有趣點在於,google究竟有沒有讓電腦參考古譜呢?


--
Tags: 圍棋

All Comments

Freda avatar
By Freda
at 2016-03-18T19:21
原po所謂官子崩壞, 是他認為怎麼下都不夠贏的狀態
Dinah avatar
By Dinah
at 2016-03-21T04:55
除非kgs上有古人 否則不會有古譜
Robert avatar
By Robert
at 2016-03-23T02:41
恐怕這也就是這樣了。真希望多一些古風
Barb Cronin avatar
By Barb Cronin
at 2016-03-26T16:39
古譜到底有幾局?一千局也不夠塞阿發狗的牙縫
Yedda avatar
By Yedda
at 2016-03-26T21:31
你第一張圖的電腦就下錯了
它不拘小節,反過來說從小地方是突然口
Quanna avatar
By Quanna
at 2016-03-31T04:18
這是我沒說清楚。第一譜局部棄一子造成死活問題,官子
Suhail Hany avatar
By Suhail Hany
at 2016-03-31T07:06
受損。反過來卻看出他有比較割一子與聯回三子的大小
Margaret avatar
By Margaret
at 2016-04-04T19:57
而且局部確實連回三子大(吧?)
Candice avatar
By Candice
at 2016-04-06T17:57
那不只三子 是巨龍死活 m君說的下錯 應是指吃法
Mia avatar
By Mia
at 2016-04-07T21:16
是指一路的吃法?

葉罡廷7段 人機大戰第3.4盤實況影片

Doris avatar
By Doris
at 2016-03-14T21:07
https://www.twitch.tv/mariakoutei42/v/54374930 人機大戰第3.4盤實況影片出爐~~~ 終於破100人啦(灑花 謝謝大家收看 可以的話幫我粉絲頁按個讚!! -- Sent from my Windows - ...

或許類似征子的大型單行道棋形才是弱點

Christine avatar
By Christine
at 2016-03-14T21:02
這幾天看來看去似乎最多篇文章都是想要針對打劫來突破 不過很少人討論征子...我個人覺得這可能是一個突破點 (其實我覺得#1MveEG8q 這篇內文和推文有些跟我想法就有點相似...) 為什麼會覺得征子是一個突破點呢 因為他是一個手數很長的單行道 以前AI用的Alpha-Beta系列演算法和現在 ...

韓媒:不應神化人機圍棋戰 阿爾法應受尊

Edward Lewis avatar
By Edward Lewis
at 2016-03-14T20:25
韓媒:不應神化人機圍棋戰意義 阿爾法應受尊敬 北京時間3月14日消息,在人機世紀大戰的第四局比賽中,此前連贏三局拿下賽點的穀歌 (Google)旗下的Deep Mind開發的阿爾法圍棋(AlphaGo)出現失誤,把勝利拱手讓給了 韓國頂級棋手李世石九段,遭遇到了首場失利。不少人都對迄今一直表現冷靜、顯示出 ...

寺山憐日本圍棋苦寒的背影 望重新贏回尊

Ophelia avatar
By Ophelia
at 2016-03-14T20:20
寺山憐日本圍棋苦寒的背影 望重新贏回尊重 北京新浪網 (2016-03-14 19:31) 近日,第三屆百靈杯世界圍棋公開賽預選賽在中國棋院再燃戰火。中韓各路悍將無不摩拳 擦掌,躍躍欲試。十四名代表各自國家和地區圍棋最高水平的種子選手名單亦相繼揭開面 紗,宣告正式出爐。當目光掃到日本種子代表選手一欄時,但 ...

棋界必然因為AI需要變革

Oliver avatar
By Oliver
at 2016-03-14T19:26
將來電腦圍棋勢必屌打人類 如果將來職棋遇到勝負手 只要假借廁所或抽菸什麼的 把棋局輸入手機就能得到必勝一手 根本無從防範 除非搞成實境秀 無時無刻攝影機都要跟 包括去廁所大便 不然簡直比運動禁藥還恐怖 或是比賽前搜身 禁止帶任何電子產品 比賽關在類似禁閉室的空間對戰 當然有些不近人情 或是有其 ...