Re: 從象棋觀點看AlphaGO為什麼會輸 - 圍棋

James · 2016-03-14

Table of Contents

Post
Comments
Related Posts

其實寫得很好！
只是有些許地方我覺得有些疑問

: 會下出黑101的理由同上電腦算不出分數更高的棋會傾向「維持現狀」...
: 奇怪了我怎麼突然覺得我的用詞有政治意味............XDDDDDDDDD

alphago會不會傾向於維持現狀，我不是非常了解。
主要疑惑點在於官子

http://i.imgur.com/siQwKgm.png

這是alphago在nature中提供的運算原理簡圖。
圖下有詳細說明。
大致上是說：
(a)系統會先選點，
予以最高行動值(action value)"Q"+u x 預先機率(Prior probability)"P"
找出最大者
(b)擴張
找分枝。
(c)演化後
(d)迴車
至初始點，修正機率。

換而言之，因為行動值的參與，所以與目數或點數相關。
因為有迴圈協助，機率不會完全參照當下情形，更重於未來發展。

: 最後來解釋一下末段AlphaGO官子崩壞的問題...
: 這個可能是AlphaGO以機率進行計算所產生的獨特問題
: 非常值得重視和研究！
: 因為對於人類而言下到官子階段所判斷的單位是「子」或者是「目」
: 這和比賽勝負的計算單位是相同的是一個絕對的值
: 比如同樣後手官子一個5目一個3目那當然是5目的大這是絕對的
: 可是如果轉換成「勝率」概念那就不一樣了！
: 「勝率」本質上是一個會隨著棋盤上子數變動的東西......
: 當棋盤上的子數越來越多代表棋局越進入尾聲勝率會越確定
: 反之棋局越早期勝率會越變動...
: AlphaGO用勝率為單位做計算所面臨的問題是：
: 它沒有辦法真正有效區辨官子的大小
: 因為當它優勢的時候：贏5目也是贏贏3目也是贏
: 劣勢輸5目也是輸輸3目也是輸

所以這個說法有些不太合理。
第一局的後半期白棋已非常優勢。而白棋也未放鬆。

http://i.imgur.com/4lV2dLt.png

倘若電腦白棋不知官子，為何下此處而不補左下角？

http://i.imgur.com/LHcxAqb.png

第三局，若電腦白棋不知官子，又如何知道96求先手後98檔？108點入後做活？

倘若原po說的沒錯，李世石下到後面豈不是都能半目負？

個人覺得不應該因為第四盤而小看電腦官子。
一般，根據過去電腦圍棋的經驗，官子一定是電腦最為擅長的。
畢竟排出先後手、比大小、分析死活後，一個演算法就能輕鬆排出最佳解。
這也是人腦官子的邏輯。

雖然alphago的演算法與過去不同，沒有詳細編碼能參考，
但也明顯未捨棄地域的參數。至於優劣就不清楚了。

: 這就是說用勝率計算的話
: 一個後手5目官子和一個後手3目官子對AlphaGO而言很可能都一樣！
: 因為改變不了比賽結局！
: 這樣一來在優勢的時候它很可能下鬆不過還可以維持在安全運轉的範圍之內
: 因為它總是會選擇勝率大於50%的棋步......
: 但劣勢的情況下則可能變成像是完全隨機亂走！
: 因為官子不分大小看起來都是輸！通通都一樣！
: 這樣的話根本沒有辦法在劣勢情境下走出有效的抗衡手段是非常嚴重的缺點！
: 我認為這個BUG的嚴重性可能會導致AlphaGO完全重寫
: 下一代的BetaGO(?)應該會重回以「子」或「目」作為基本計算單位的架構
: 然後再慢慢去養......
: 話說這個基本單位問題的取捨是很重大的議題
: 研究團隊應該有針對這個東西開發了幾個前期版本加以實驗才對...
: 我猜想以勝率為基本單位的優點
: 應該是在棋局前期根本無法換算出確定地的情況下用勝率去判斷會比較靈敏？
: 無論如何這造就了一代佈局直覺狂勝人類的AlphaGO
: 衷心讚嘆Deepmind團隊對於棋藝的卓越貢獻！希望能繼續進步！

至於電腦的特點，相信各位經過幾天觀察也很清楚了。
電腦算機率，算可能性，畢竟是找出最適合夏法的直線型思考。

所以棋風硬直，輕巧處裡的不多。

對於打入的演算十分敏感

第一局的18,78, 102
第三局108
第四局的113

騰挪算是前中期極強的

第三局尤為出色

之所以稱為硬直是我的感覺，因為除了第三局的32算是極具輕靈色彩的好棋，其餘多數
，除了極愛尖衝外，都為硬碰硬的棋風。非常具有現代特色。

可偏偏許多鬼手妙手並不在機率之中。
https://www.youtube.com/watch?v=4JswWVN2NcQ

就看第五名(第一局)
這種一路死活相關的妙手在演算中就不可能出現。一沒地、二沒氣，正常算法都沒優勢。
更別說以前也沒什麼人下過，局勢也十分新穎。

電腦下的出才怪。

第四局的李世石妙手就是明證。

圍棋中也有很多時候，是十手、十幾手後有某個妙手，因此當下著法是惡手。

因此，圍繞著妙手惡手的設局，恐怕才是下贏電腦的關鍵。

有趣點在於，google究竟有沒有讓電腦參考古譜呢？

--

圍棋