Alphago的弱點 - 圍棋

Table of Contents




http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works


Shou-de Lin Facebook上面最新的文章(一直判定廣告網站不能貼)

這裡有講alphago的怎麼運作的

"反而利用過去學到的policy 結合了蒙地卡羅樹狀搜尋(MCTS)的方法找出最好棋步"


"必須要能夠走出前所未見的局面,降低它對於盤面估測的準確度才會有機會"


可以解釋為甚麼在李九段下出神之一手後就開始秀逗了

alphago利用過去棋譜和不斷自我訓練得一個函數

加上蒙地卡羅樹狀搜尋 來模擬最好的棋步

因為這神之一步是alphago在這幾千萬局中完全沒模擬到的一步

導致模擬全部重來所以之後幾步都下出低級失誤

弱點非常清楚下出alphago沒想出的一步

不過這一步的機會只能用一次

但是因為alphgo能一直不斷學習

這棋譜加入資料庫後同樣的手法就沒用了

所以第五局除非李九段可以下出和今天一樣的神之一手不然沒有機會贏

問題是根本不知道alphago哪些是它下過、哪些是它沒下過的

--

All Comments

Noah avatarNoah2016-03-15
其實最有趣的是Alphago不知他在下棋XD
Hazel avatarHazel2016-03-18
聖鬥士表示:
Gilbert avatarGilbert2016-03-18
希望阿法狗是蘿莉
Freda avatarFreda2016-03-20
這是誤解吧,每一手AG都是獨立模擬計算,沒有全部重來的
Rebecca avatarRebecca2016-03-23
說法?應該是形勢判斷的邏輯編寫上有問題。
Michael avatarMichael2016-03-24
希望週二能再現奇蹟
Connor avatarConnor2016-03-26
我覺得這次李世石在棋界重返顛峰
Lauren avatarLauren2016-03-30
神之一手!?
Sierra Rose avatarSierra Rose2016-04-04
如果他下場順序放法都一樣,也會贏,因為alpha還沒修正,但
李不會這樣做,就是了
Delia avatarDelia2016-04-05
應該是有很多選擇可以下,不一定會一樣吧
就算你跟一般電腦玩,也不太可能按部就班每次就會一樣
Rae avatarRae2016-04-08
這盤棋只是他千萬模型的一個,要影響整個學習成果還早
Andy avatarAndy2016-04-10
這隱含的意義是過去以人類棋譜為主的訓練有問題
也難怪已經計畫好要砍掉重練了
Emily avatarEmily2016-04-11
神個蛋 感覺狗狗被調過了 顯然deepmind不想太招遙
全敗太難看 讓一下輸一場較好 那麼低級的失誤誰相信
Susan avatarSusan2016-04-13
兩方輸了都有人不相信崩潰 板上也不少
Jacky avatarJacky2016-04-13
果然出現了XDD 我就知道有人會說阿發夠被調過 這跟之前
懷疑保密協定是有啥兩樣
Edward Lewis avatarEdward Lewis2016-04-15
推"liaon98: 兩方輸了都有人不相信崩潰"XDDD
Jack avatarJack2016-04-17
alphago以為自己在算數學呢
Oliver avatarOliver2016-04-18
進化過的陰謀論嗎 XD
Donna avatarDonna2016-04-21
MK12 亂說,MC 每次算出的機率又不會一樣
John avatarJohn2016-04-21
阿法溝的下法有玩過電腦圍棋的應該都看過,只是他是
阿發溝,怎麼會犯這種低級失誤 XDDDDDD
Leila avatarLeila2016-04-24
我覺得現在在講Alphago低級失誤的跟前三盤在講李失誤的
Una avatarUna2016-04-24
的不覺得有即視感嗎?他之所以沒下出好棋是因為對手逼出
Ursula avatarUrsula2016-04-25
只能推liaon98了...不知道後天又是哪一方崩潰XDD
Joseph avatarJoseph2016-04-28
來的,就像Google說明了AI到87步發覺了79步開始下錯了
而79步之後的局面是因為李78步的絕妙好棋造成的
John avatarJohn2016-04-30
我不是指誤算喔,我是指必死棋還補一手和下那種低段才
會下的死活棋. 不過也很合理,電腦只會想贏,他哪知道
Audriana avatarAudriana2016-05-01
對手實力來決定對方最簡單的死活是否會出錯...
Joe avatarJoe2016-05-04
其實看過這篇就多半會懷疑AlphaGo的 value net 偶爾會錯了
Mason avatarMason2016-05-05
http://goo.gl/3qzyIv <- 奇怪的圖片偶而騙過 net
Edith avatarEdith2016-05-07
AlphaGo 就是把棋盤當成圖片餵給類似上面文章的 net
Barb Cronin avatarBarb Cronin2016-05-09
真的, 那步棋就是全場狐疑怎麼會下在那邊
Yedda avatarYedda2016-05-14
以籃球比喻, 失誤可能是投球沒進或運球掉球
而那手就好像AlphaGo拿球跑去投自己籃送你分
Sierra Rose avatarSierra Rose2016-05-15
不過這也說明人跟AI的差別, 重要決定還是不能只由AI決定
Necoo avatarNecoo2016-05-17
Alphago沒有資料庫 是靠不停得自我修正程式