Alphago的弱點 - 圍棋

Skylar DavisLinda · 2016-03-13

Table of Contents

Post
Comments
Related Posts

http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works

Shou-de Lin Facebook上面最新的文章(一直判定廣告網站不能貼)

這裡有講alphago的怎麼運作的

"反而利用過去學到的policy 結合了蒙地卡羅樹狀搜尋(MCTS)的方法找出最好棋步"

"必須要能夠走出前所未見的局面，降低它對於盤面估測的準確度才會有機會"

可以解釋為甚麼在李九段下出神之一手後就開始秀逗了

alphago利用過去棋譜和不斷自我訓練得一個函數

加上蒙地卡羅樹狀搜尋來模擬最好的棋步

因為這神之一步是alphago在這幾千萬局中完全沒模擬到的一步

導致模擬全部重來所以之後幾步都下出低級失誤

弱點非常清楚下出alphago沒想出的一步

不過這一步的機會只能用一次

但是因為alphgo能一直不斷學習

這棋譜加入資料庫後同樣的手法就沒用了

所以第五局除非李九段可以下出和今天一樣的神之一手不然沒有機會贏

問題是根本不知道alphago哪些是它下過、哪些是它沒下過的

--

All Comments

Noah2016-03-15

其實最有趣的是Alphago不知他在下棋XD

Hazel2016-03-18

聖鬥士表示:

Gilbert2016-03-18

希望阿法狗是蘿莉

Freda2016-03-20

這是誤解吧，每一手AG都是獨立模擬計算，沒有全部重來的

Rebecca2016-03-23

說法？應該是形勢判斷的邏輯編寫上有問題。

Michael2016-03-24

希望週二能再現奇蹟

Connor2016-03-26

我覺得這次李世石在棋界重返顛峰

Lauren2016-03-30

神之一手！？

Sierra Rose2016-04-04

如果他下場順序放法都一樣，也會贏，因為alpha還沒修正，但
李不會這樣做，就是了

Delia2016-04-05

應該是有很多選擇可以下，不一定會一樣吧
就算你跟一般電腦玩，也不太可能按部就班每次就會一樣

Rae2016-04-08

這盤棋只是他千萬模型的一個，要影響整個學習成果還早

Andy2016-04-10

這隱含的意義是過去以人類棋譜為主的訓練有問題
也難怪已經計畫好要砍掉重練了

Emily2016-04-11

神個蛋感覺狗狗被調過了顯然deepmind不想太招遙
全敗太難看讓一下輸一場較好那麼低級的失誤誰相信

Susan2016-04-13

兩方輸了都有人不相信崩潰板上也不少

Jacky2016-04-13

果然出現了XDD 我就知道有人會說阿發夠被調過這跟之前
懷疑保密協定是有啥兩樣

Edward Lewis2016-04-15

推"liaon98: 兩方輸了都有人不相信崩潰"XDDD

Jack2016-04-17

alphago以為自己在算數學呢

Oliver2016-04-18

進化過的陰謀論嗎 XD

Donna2016-04-21

MK12 亂說，MC 每次算出的機率又不會一樣

John2016-04-21

阿法溝的下法有玩過電腦圍棋的應該都看過,只是他是
阿發溝,怎麼會犯這種低級失誤 XDDDDDD

Leila2016-04-24

我覺得現在在講Alphago低級失誤的跟前三盤在講李失誤的

Una2016-04-24

的不覺得有即視感嗎?他之所以沒下出好棋是因為對手逼出

Ursula2016-04-25

只能推liaon98了...不知道後天又是哪一方崩潰XDD

Joseph2016-04-28

來的，就像Google說明了AI到87步發覺了79步開始下錯了
而79步之後的局面是因為李78步的絕妙好棋造成的

John2016-04-30

我不是指誤算喔,我是指必死棋還補一手和下那種低段才
會下的死活棋. 不過也很合理,電腦只會想贏,他哪知道

Audriana2016-05-01

對手實力來決定對方最簡單的死活是否會出錯...

Joe2016-05-04

其實看過這篇就多半會懷疑AlphaGo的 value net 偶爾會錯了

Mason2016-05-05

http://goo.gl/3qzyIv <- 奇怪的圖片偶而騙過 net

Edith2016-05-07

AlphaGo 就是把棋盤當成圖片餵給類似上面文章的 net

Barb Cronin2016-05-09

真的, 那步棋就是全場狐疑怎麼會下在那邊

Yedda2016-05-14

以籃球比喻, 失誤可能是投球沒進或運球掉球
而那手就好像AlphaGo拿球跑去投自己籃送你分

Sierra Rose2016-05-15

不過這也說明人跟AI的差別, 重要決定還是不能只由AI決定

Necoo2016-05-17

Alphago沒有資料庫是靠不停得自我修正程式