Alphago的弱點 - 圍棋

Damian avatar
By Damian
at 2016-03-13T22:21

Table of Contents

※ 引述《turing (涂妮)》之銘言:
: 再看今天第78手後,發生什麼事情?
: 明顯這個「神之一手」不在其策略網路之前估計的棋步中。
: 所以,之前所有值網路所估計的勝率全部報廢。
: AlphaGo必需全部重新計算勝率,而需要約五步的時間(到第79~87步)
: 值網路才回復正常。
我的看法是 Policy Network 裡面有給過神之一手 (白 78)
AlphaGo 也算過相關變化, 但是算的不夠深, 或者說 Value Network 太晚估對.

假設 AlphaGo 搜尋深度固定 8 層 (簡化說明, 實際上不是如此)

AlphaGo 79 手: 我算過 79~86 手的變化了, 86 手的 value network 有 70%
我可以安心下 79.

AlphaGo 81 手: 81 手 value network 報 70%
讓我算一下 81~88 手為止的變化
WTF! 87 手的 value network 掉到 40% ?
可是 81 手的勝率 40% (被 87 手降低) 還是最高, 只好繼續下 81.

AlphaGo 83 手: 83 手 value network 報 70%
83 手的勝率 40% 還是最高, 只好繼續下 83.

AlphaGo 83 手: 85 手 value network 報 70%
85 手的勝率 40% 還是最高, 只好繼續下 85.

AlphaGo 87 手: 87 手的 value network 報 40%
我第 81 手時知道我錯了, 可是 81 手前下錯已經走上單行道.

想避開神之一手
AlphaGo 要能搜尋的更深提早知道 87 手的盤面很劣 (但要花很多運算時間)
或是 Value Network 早一點報對, 比如說第 80 手的盤面就知道很劣.

拉長搜尋時間不太可行 (今天都快用光時間了)
把 Value Network 訓練的更準應該是 AlphaGo 主要的目標.

--
Tags: 圍棋

All Comments

Ivy avatar
By Ivy
at 2016-03-15T03:26
可是照理說minimax不是要排除嗎?:D
Cara avatar
By Cara
at 2016-03-16T19:33
自爆的那二手也是勝率最高嗎?
Victoria avatar
By Victoria
at 2016-03-19T14:20
算的不夠深所以沒排除
Xanthe avatar
By Xanthe
at 2016-03-20T17:56
如果到了2040年左右?能再多搜個幾層的話 棋士還能對抗嗎
Una avatar
By Una
at 2016-03-25T05:29
它會下它認為勝率最高的, 只是人類不一定同意.
Andy avatar
By Andy
at 2016-03-29T02:53
也有可能是mcts裡的rollout policy太爛,分支就被剪掉了
Annie avatar
By Annie
at 2016-04-02T05:04
實際上計算是 MCTS, 評估網路認為沒那麼重要的 就不會
算那麼深(時間夠或計算資源多還是可能會算到 但不保證)
Zanna avatar
By Zanna
at 2016-04-02T07:00
可是是因為AG下了69才會有78的發生
Catherine avatar
By Catherine
at 2016-04-03T07:41
自爆的時候可能決策系統給出的勝率都很低了
Wallis avatar
By Wallis
at 2016-04-06T11:12
minmax 是看他深度決定的 有可能 min 在更深的地方
Harry avatar
By Harry
at 2016-04-10T22:01
應該反過來講 它在計算 69 的時候是看不到 78 的
除非評估網路認為 78 這位置夠重要, 才有可能算到
Ula avatar
By Ula
at 2016-04-15T12:50
所以,實際上AG在評估69要下哪邊時就做錯決定了...
Rebecca avatar
By Rebecca
at 2016-04-19T17:39
等到他真的遇到了 就 GG 了
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2016-04-23T12:01
有量子電腦就能試試窮舉了呀,但還久
Rebecca avatar
By Rebecca
at 2016-04-24T03:53
電腦對下不太容易發現這種問題 因為雙方評估差不到哪去
Elma avatar
By Elma
at 2016-04-25T09:52
這個局部的洞估計兩邊都很難在夠早的地方看到 就是運氣
Rebecca avatar
By Rebecca
at 2016-04-27T22:51
還在minmax, 通通回去看完論文再來推文
Hedy avatar
By Hedy
at 2016-05-02T02:44
不是運氣 他扳右邊二子頭其實非必要
Daph Bay avatar
By Daph Bay
at 2016-05-05T09:23
不懂。如果他早知道正常下87手勝率很低,79手就不會覺得
Joseph avatar
By Joseph
at 2016-05-09T01:41
勝率高吧? 我不懂MCTS,但我以為這裡收斂到minimax很快
Catherine avatar
By Catherine
at 2016-05-11T13:38
2040有量子電腦出現的話應該就窮舉了
Una avatar
By Una
at 2016-05-12T22:22
感謝原po XD 想來我本來看錯了,不過這跟Demis說法不符?
Iris avatar
By Iris
at 2016-05-13T15:22
修改一下比較清楚
Todd Johnson avatar
By Todd Johnson
at 2016-05-18T05:08
就是Demis說AlphaGo的回報勝率到87才降
Caroline avatar
By Caroline
at 2016-05-22T03:12
Demis 可能透過 AlphaGo 知道 79 手下別處沒那麼差
value network 的確是到 87 手才降的
Heather avatar
By Heather
at 2016-05-24T08:25
搜尋樹回報的勝率是後續幾手 value network 決定
Eartha avatar
By Eartha
at 2016-05-27T14:23
Demis 指的是 value network 到 87 手才知道劣太晚了
Daniel avatar
By Daniel
at 2016-05-31T05:09
我不會這樣解讀Demis的說法XD 不過說不定是你說的這樣
Agatha avatar
By Agatha
at 2016-06-01T00:21
等等,你說的真是太有道理了!!! m(_ _)m感謝
Erin avatar
By Erin
at 2016-06-02T11:04
推這篇XD,我覺得對沒學過演算法的人這篇最好,
Faithe avatar
By Faithe
at 2016-06-04T02:07
你沒有討論rollout policy,不過Demis意思應該就是說
value network才是問題所在,這樣好像很難分析...

請問為什麼中國韓國棋士不去日本發展?

Selena avatar
By Selena
at 2016-03-13T21:58
大家好 想請教一下 為何韓國跟中國的棋手不太去日本棋院發展呢? 台灣的張栩 王立誠不就去日本 陳詩淵 去韓國 趙治勳 柳時薰也是去日本發展 日本國內棋戰獎金豐厚 對局費又高 與其在國內被大李小李 常昊 古力夾殺 為何不轉台去日本大殺四方? 朴永訓 崔哲瀚要是去了日本 平成四天王大概只有張栩可以 ...

神之一手存不存在?

George avatar
By George
at 2016-03-13T21:49
※ 引述《lolylolyosu (3-1次元)》之銘言: : 如題 先說小弟下棋的經驗 : 之前偶爾會和公園老伯下軍棋 : 遇到的經驗都是 : 好棋=局勢剛好+對手沒注意到 : 換個很會下棋的老伯來 : 每一步都來個緊迫盯人 : 哪來的好棋給你下? : 圍棋... 有沒有人可以解釋一下? : 至於今天的阿發 ...

AlphaGo常見問題總整理

Andrew avatar
By Andrew
at 2016-03-13T21:41
大家好, 我這幾天看了很多資料和文章, 整理了一些關於AlphaGo的常見問題和解答, 希望能減少大家對AlphaGo的誤解。 如果認為我寫的回答有錯, 或還有什麼值得編進去的問題, 都歡迎推文告知, 我會盡快修改。 全文連結: http://roger0123.blogspot.tw/2016/03 ...

Alphago的弱點

Hedda avatar
By Hedda
at 2016-03-13T21:31
先簡介AlphaGo的原理, AlphaGo有兩個主要的分析網路, 1. 策略網路 policy network 在當前的局面分析可能下的棋點,並計算出現的機率。 例如:第二局的37手的五路肩沖的機率是萬分之一。 ...

神之一手存不存在?

Irma avatar
By Irma
at 2016-03-13T21:27
如題 先說小弟下棋的經驗 之前偶爾會和公園老伯下軍棋 遇到的經驗都是 好棋=局勢剛好+對手沒注意到 換個很會下棋的老伯來 每一步都來個緊迫盯人 哪來的好棋給你下? 圍棋... 有沒有人可以解釋一下? 至於今天的阿發狗爭議 小弟認為 等阿發狗和柯潔對決再來分析 會比較客觀 畢竟谷哥沒理由 放阿發狗給柯潔洗 ...