不可思議的五路肩沖怎麼來的? - 圍棋

Olga avatar
By Olga
at 2016-03-13T06:35

Table of Contents

https://www.youtube.com/watch?v=qUAmTYHEyM8&t=15m15s

第三戰賽前訪問重點整理 - 不可思議的五路肩沖怎麼來

AlphaGo 計畫的領導人David Silver

(重點聽譯 有誤請見諒)

1.
Redmond(美國九段)問:
第二戰的黑37手五路肩沖太令人驚訝了,
我從來沒看人家這樣下過,阿法狗是怎麼想出來的?

Silver回:
很多人都問我這個問題,我就回去找資料看看阿法狗到底是怎麼想出來的,
阿法狗有個模型,也就是方針網路(Policy Network),
是利用人類過去所下過的棋譜,來訓練這個方針網路,
讓這個模型可以預測人類下一步會怎麼下。

然後我就問阿法狗,到底過去人類會下這步五路肩沖的機率有多少?
阿法狗說,人類棋手只有萬分之一的機率會選擇下五路肩沖這步棋。
(咩按:怪不得李世石要中離去抽菸啊~根本整人嘛)
雖然機率很低,但阿法狗還是有去搜尋這步棋,
經過往下評估計算之後(Value Network, Roll Out等),發現這步真的是好棋,
所以就下了這步棋。

2.
Redmond問:
即使人類下的機率這麼低,阿法狗還是選擇這樣下了,
表示人類選擇怎麼下的機率不會影響到阿法狗嗎?

Silver回:
人類下一步怎麼下的機率,只是在最開始的時候,提供阿法狗一些搜尋的初始選項,
實際會怎麼下還是要依靠阿法狗自己後續的評估結果。
(咩按:所以阿法狗有點像是依靠人類的過去下過的棋步,
來捨棄一些根本不需要考慮的位置,所以初手大元還是有可能的(誤))

3.
Garlock問:
阿法狗幾歲?(咩按:這問題...)

Silver回:
兩歲。(咩按:開始講一些古,台灣之光AlphaGo的臉,黃士傑,巴拉巴拉)
去年發表論文,發現光練習古人的譜,不用做任何計算,AI就可以有業餘段位水準,
整個很吃驚。所以就覺得很有希望,跑去找CEO談談,結果就開了projetc,
找了很多人進來,成就了阿法狗跟這場世紀之戰。

4.
Redmond問:
阿法狗打敗了世界冠軍,有人說你們有針對李世石做軟體上的調整
但剛剛聽你講起來發現好像不太可能?

Silver回:
阿法狗是用幾十萬份的棋譜去訓練出來的,李世石的譜在數量上相比起來,
就好像把一滴水丟到大海裡一樣,
不太可能顯著的去影響阿法狗的棋風,而且阿法狗還有很多自我對局的強化學習。
對我來講,我們很難調整阿法狗去針對李世石,
相反的,李世石是一個很棒的棋手,
他比我們還更可能去適應阿法狗的棋風。(咩按:其實還挺有道理的)

而且只針對一個棋手去調整,其實還蠻危險的。
我們的設計目標很簡單,就是設計一個程式來讓勝利的機率最大化。
我們在比賽前我們還中止了阿法狗的發展進程,讓我們可以順利測試,
所以在比賽過程中,程式的版本其實是沒有改變的。

5.
Redmond問:
你覺得像五路肩沖這種神奇棋步,有可能會持續出現嗎?

Silver回:
我們在比賽中學到很多,從像你這樣的解說評論與分析等等,
我們選擇李世石也是認為他可以測試到阿法狗的極限,
但其實我們不知道阿法狗會怎麼下
我們雖然創造它,但這時候也只能站旁邊看它會怎麼下,
不然我現在應該是在努力coding,而不是來接受訪問。
(咩按:AI可以讓你不用再當好人工程師)

6.
Garlock問:
我聽說阿法狗現在好像甚至不需要人類過去的棋譜來輔助?
聽說可以從零開始左右互搏訓練,也太讓人驚訝了吧
Silver回:
目前阿法狗的確是從人類過去的棋譜來學習,
但是從零開始訓練,的確是我們未來的計劃,
或許棋風會變得很不一樣也說不定。

(咩按:最後再說了一些這可能是五百年來最出名的圍棋賽等等...)

--
Tags: 圍棋

All Comments

Iris avatar
By Iris
at 2016-03-17T13:27
Adele avatar
By Adele
at 2016-03-20T23:04
感謝翻譯
Kumar avatar
By Kumar
at 2016-03-24T14:22
再推一次XD,重點擷得太好了
Agnes avatar
By Agnes
at 2016-03-28T14:37
話說按照圍棋用語會不會稱他是日本九段? :p
Bethany avatar
By Bethany
at 2016-03-31T18:19
太狂了!人類哪有機會在有限時間內探索機率只有萬分之一的分
支!
Rebecca avatar
By Rebecca
at 2016-04-04T04:44
我覺得有意義的是去套討為什麼阿法狗會認為那是好棋
人不是因為萬分之一沒有時間想到 而是因為普遍不會認為那是
Genevieve avatar
By Genevieve
at 2016-04-05T02:12
好棋 才選擇不下 讓機率變成萬分之一
Megan avatar
By Megan
at 2016-04-08T07:32
成為好棋的原因就是alphaGo把那步棋在想像中下了幾千次,盡
可能探索各種變化,結果還不錯,就真的選擇下了。
Yedda avatar
By Yedda
at 2016-04-12T08:38
所以我的意思就是那些變化到底可不可以慢慢被人歸納 還是像
Connor avatar
By Connor
at 2016-04-12T18:32
這些手是永遠模仿不能的 不過有些人認為勝率高不代表是好棋
我是覺得既然AG算到那麼多步還認為這是勝率最高的一手 那就
有研究的價值
Xanthe avatar
By Xanthe
at 2016-04-17T17:38
我個人意見是如果並非只牽扯到局部,而是廣泛影響到全局的
好手,人不必研究了,AG已經研究過了,讓他把其中幾個變化
輸出給人聞香就好了。再怎麼樣探索,單憑人力,下次在比賽
中出現類似的盤面,也只能強記,無法即時探索更遠。但當人
開始強記無法消化的棋步,棋這門可稱作藝術的競技就感覺沒
有美感了。
Charlotte avatar
By Charlotte
at 2016-04-22T12:54
日本棋手表示:你們開始重視下棋的美感了嗎^_^
Megan avatar
By Megan
at 2016-04-23T09:51
感謝阿發狗促成圍棋必須講究美感的共識
Eartha avatar
By Eartha
at 2016-04-27T22:43
我覺得換個問法五路尖衝小李為何不爬四路那邊要出頭
Isabella avatar
By Isabella
at 2016-04-29T00:40
推樓上。也許後續又有什麼很不像人類的妙手配合?
Frederic avatar
By Frederic
at 2016-05-03T11:20
好文
Bethany avatar
By Bethany
at 2016-05-07T14:35
開盤階段平均每個點被考慮到的機率是千分之三。對電腦而
言萬分之一其實不低。至少它還排在候選名單中。我想會不會
開盤時所有三四五路的點都想一下。
Faithe avatar
By Faithe
at 2016-05-08T00:24
人類要脫離制式規範被舊有經驗侷限
創意才有辦法打敗阿法狗
Agatha avatar
By Agatha
at 2016-05-11T19:58
我覺得萬分之一感覺上已經很接近要被剪掉了耶@@
至少傳統minimax的變體,如果統計上最佳解機率萬分之一
應該就cut掉了唄?
Carol avatar
By Carol
at 2016-05-14T12:40
以前覺得不可行的事實上是因為經驗累積
但人類經驗只占不知道幾個百分比而已
Candice avatar
By Candice
at 2016-05-18T04:14
萬分之一是職業棋譜帶來的 bias 後面他還是有自己考慮
Audriana avatar
By Audriana
at 2016-05-20T18:23
萬分之一是高段職業棋手下出的可能性
Wallis avatar
By Wallis
at 2016-05-23T01:51
AlphaGo原理上會先用職業棋譜嘗試排除那些必敗的下法
Charlie avatar
By Charlie
at 2016-05-23T20:22
對orz 我想錯了,關鍵是rollout算到底可能還比SL策略網
Dinah avatar
By Dinah
at 2016-05-24T16:39
路快,沒理由不同時rollout一下
Caitlin avatar
By Caitlin
at 2016-05-25T03:31
其實如果萬分之一的機率在所有候選點的排名還有前二十,那
機器還滿有餘裕去細究的。
Franklin avatar
By Franklin
at 2016-05-29T06:06
我很悲觀地想 那五路肩衝不是賽中臨時測試出來的
而是平時自我對練發現的 而且已融入AlphaGO自身 也就是
James avatar
By James
at 2016-06-03T05:33
網路上有些人說 "AlphaGo 吸收了人類百年千年來的經驗
Faithe avatar
By Faithe
at 2016-06-03T10:16
AlphaGO在比賽前 就已經準備了數量不知多少的妙手 等著
人類去挖 只要對戰棋手程度夠 是可以挖出更多妙手的
Xanthe avatar
By Xanthe
at 2016-06-03T13:18
所以贏李是自然的" 但是從37手前人只有萬分之一的機率來看
Lydia avatar
By Lydia
at 2016-06-08T09:08
這個說法已經不攻自破了. 37 手 AlphaGo 是靠自己下的.
Barb Cronin avatar
By Barb Cronin
at 2016-06-08T10:49
對不起 moonlind 和你交叉了 orz
Ivy avatar
By Ivy
at 2016-06-08T22:04
沒關係啦 我很期待沒人類經驗的AlphaGO跟目前的對戰
Sarah avatar
By Sarah
at 2016-06-09T05:42
藉此測試究竟人類的經驗究竟孰輕孰重 若勝率50% 很可能
Kristin avatar
By Kristin
at 2016-06-12T07:08
代表 人類所謂經驗 僅滄海一粟 如果勝率低於50%...
Callum avatar
By Callum
at 2016-06-13T05:54
更慘 代表人類有自我的盲點 並且累積成不可忽視的缺失
Jack avatar
By Jack
at 2016-06-15T04:30
這五路尖衝也只有這局能用吧
Hazel avatar
By Hazel
at 2016-06-18T14:00
可以歸納才能被人類拿來使用 不過這也將是人類的浪漫了
Genevieve avatar
By Genevieve
at 2016-06-19T05:25
實際上就是AlphaGo在圍棋上已經走得比人類更遠了
Belly avatar
By Belly
at 2016-06-22T06:14
以前常說AI不可能算贏人類 是因為圍棋盤面變化多達170
Barb Cronin avatar
By Barb Cronin
at 2016-06-26T06:05
位數 但實際上人類上千年累積起來的圍棋經驗 離這個17
Thomas avatar
By Thomas
at 2016-06-30T11:21
0位數也還差得很遠
Mary avatar
By Mary
at 2016-07-01T16:25
所以必須多嘗試以前不敢做的就會變化出不同局勢
Jacob avatar
By Jacob
at 2016-07-02T01:26
蠻好奇如果把AI目標設定成贏最大目數會生神摸事
Charlotte avatar
By Charlotte
at 2016-07-03T00:37
https://www.youtube.com/watch?v=Qf47NatflfM 47:30那裡
Xanthe avatar
By Xanthe
at 2016-07-06T04:01
我覺得這解釋還蠻有道理的, 跟前面的尖有關係
Sarah avatar
By Sarah
at 2016-07-08T13:36
要設定最大子效的話,一定要設定時間,不然會算到天荒
地老也算不完
Victoria avatar
By Victoria
at 2016-07-11T10:14
所以在比賽過程中,程式的版本其實是沒有改變的。 可怕阿
也就是其實三戰都沒有即時更新..........
Poppy avatar
By Poppy
at 2016-07-16T03:36
https://www.youtube.com/watch?v=SUbqykXVx0A
Linda avatar
By Linda
at 2016-07-17T14:16
這手棋實在太酷了

從前兩局推測AlphaGo算法的重大進展

Poppy avatar
By Poppy
at 2016-03-13T04:02
http://www.guancha.cn/chenjing/2016_03_12_353697_s.shtml 陳經 2016年3月10日人機大戰第二局,AlphaGo執黑211手中盤勝李世石。對於不懂圍棋的圍觀群眾,這意味著機器以5:0獲勝的前景確認,可能會轉而關注人工智能進步對社會的影響。對棋迷特別 ...

李世石(黑) - AlphaGo(白) 第三局棋譜

Leila avatar
By Leila
at 2016-03-13T02:18
內容有古力在野狐的評論,跟唐韋星網路上人家整理好的發言 https://drive.google.com/file/d/0B-ueHARydiA8by15Mk1STXozQmM/view?usp=sharing 搞了快4個小時,有需要請自取 - ...

古力第三盤復盤講解

Donna avatar
By Donna
at 2016-03-13T01:25
今天比完後,古力在復盤說明第三盤,沒有看到的網友可以看看 https://www.youtube.com/watch?v=4VAKMiz1P3k 另外人機大戰:李世石完敗 連輸三局 動搖圍棋界理念 https://www.youtube.com/watch?v=E68PoNS-5_k 柯潔接受訪問,談 ...

如果讓alphago吃的棋譜只到50年前

Olivia avatar
By Olivia
at 2016-03-13T01:14
這樣有機會嗎 還是阿法狗會自行走出不同於人類這五十年來圍棋不同的發展? 因為有人說阿法狗有各個大師融會貫通的樣子 那這樣來說 阿法狗不就是還沒有超越人類的理解範圍? - ...

柯潔和阿發狗的結局

William avatar
By William
at 2016-03-13T01:10
基本上應該會成局,而且可以推論出兩種結局… 一、柯贏 「早說過我對上任何棋手都是世界第一,何況區區一台機器?糟糕,忘了我要謙虛一點, 哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈!!」 二、柯輸 「不想說了,輸了就輸了,有種你們來下阿!!」接著21萬關注人數瞬間變不足1萬,黯 然關閉微博。 ...