不可思議的五路肩沖怎麼來的? - 圍棋
By Olga
at 2016-03-13T06:35
at 2016-03-13T06:35
Table of Contents
https://www.youtube.com/watch?v=qUAmTYHEyM8&t=15m15s
第三戰賽前訪問重點整理 - 不可思議的五路肩沖怎麼來
AlphaGo 計畫的領導人David Silver
(重點聽譯 有誤請見諒)
1.
Redmond(美國九段)問:
第二戰的黑37手五路肩沖太令人驚訝了,
我從來沒看人家這樣下過,阿法狗是怎麼想出來的?
Silver回:
很多人都問我這個問題,我就回去找資料看看阿法狗到底是怎麼想出來的,
阿法狗有個模型,也就是方針網路(Policy Network),
是利用人類過去所下過的棋譜,來訓練這個方針網路,
讓這個模型可以預測人類下一步會怎麼下。
然後我就問阿法狗,到底過去人類會下這步五路肩沖的機率有多少?
阿法狗說,人類棋手只有萬分之一的機率會選擇下五路肩沖這步棋。
(咩按:怪不得李世石要中離去抽菸啊~根本整人嘛)
雖然機率很低,但阿法狗還是有去搜尋這步棋,
經過往下評估計算之後(Value Network, Roll Out等),發現這步真的是好棋,
所以就下了這步棋。
2.
Redmond問:
即使人類下的機率這麼低,阿法狗還是選擇這樣下了,
表示人類選擇怎麼下的機率不會影響到阿法狗嗎?
Silver回:
人類下一步怎麼下的機率,只是在最開始的時候,提供阿法狗一些搜尋的初始選項,
實際會怎麼下還是要依靠阿法狗自己後續的評估結果。
(咩按:所以阿法狗有點像是依靠人類的過去下過的棋步,
來捨棄一些根本不需要考慮的位置,所以初手大元還是有可能的(誤))
3.
Garlock問:
阿法狗幾歲?(咩按:這問題...)
Silver回:
兩歲。(咩按:開始講一些古,台灣之光AlphaGo的臉,黃士傑,巴拉巴拉)
去年發表論文,發現光練習古人的譜,不用做任何計算,AI就可以有業餘段位水準,
整個很吃驚。所以就覺得很有希望,跑去找CEO談談,結果就開了projetc,
找了很多人進來,成就了阿法狗跟這場世紀之戰。
4.
Redmond問:
阿法狗打敗了世界冠軍,有人說你們有針對李世石做軟體上的調整,
但剛剛聽你講起來發現好像不太可能?
Silver回:
阿法狗是用幾十萬份的棋譜去訓練出來的,李世石的譜在數量上相比起來,
就好像把一滴水丟到大海裡一樣,
不太可能顯著的去影響阿法狗的棋風,而且阿法狗還有很多自我對局的強化學習。
對我來講,我們很難調整阿法狗去針對李世石,
相反的,李世石是一個很棒的棋手,
他比我們還更可能去適應阿法狗的棋風。(咩按:其實還挺有道理的)
而且只針對一個棋手去調整,其實還蠻危險的。
我們的設計目標很簡單,就是設計一個程式來讓勝利的機率最大化。
我們在比賽前我們還中止了阿法狗的發展進程,讓我們可以順利測試,
所以在比賽過程中,程式的版本其實是沒有改變的。
5.
Redmond問:
你覺得像五路肩沖這種神奇棋步,有可能會持續出現嗎?
Silver回:
我們在比賽中學到很多,從像你這樣的解說評論與分析等等,
我們選擇李世石也是認為他可以測試到阿法狗的極限,
但其實我們不知道阿法狗會怎麼下。
我們雖然創造它,但這時候也只能站旁邊看它會怎麼下,
不然我現在應該是在努力coding,而不是來接受訪問。
(咩按:AI可以讓你不用再當好人工程師)
6.
Garlock問:
我聽說阿法狗現在好像甚至不需要人類過去的棋譜來輔助?
聽說可以從零開始左右互搏訓練,也太讓人驚訝了吧
Silver回:
目前阿法狗的確是從人類過去的棋譜來學習,
但是從零開始訓練,的確是我們未來的計劃,
或許棋風會變得很不一樣也說不定。
(咩按:最後再說了一些這可能是五百年來最出名的圍棋賽等等...)
--
第三戰賽前訪問重點整理 - 不可思議的五路肩沖怎麼來
AlphaGo 計畫的領導人David Silver
(重點聽譯 有誤請見諒)
1.
Redmond(美國九段)問:
第二戰的黑37手五路肩沖太令人驚訝了,
我從來沒看人家這樣下過,阿法狗是怎麼想出來的?
Silver回:
很多人都問我這個問題,我就回去找資料看看阿法狗到底是怎麼想出來的,
阿法狗有個模型,也就是方針網路(Policy Network),
是利用人類過去所下過的棋譜,來訓練這個方針網路,
讓這個模型可以預測人類下一步會怎麼下。
然後我就問阿法狗,到底過去人類會下這步五路肩沖的機率有多少?
阿法狗說,人類棋手只有萬分之一的機率會選擇下五路肩沖這步棋。
(咩按:怪不得李世石要中離去抽菸啊~根本整人嘛)
雖然機率很低,但阿法狗還是有去搜尋這步棋,
經過往下評估計算之後(Value Network, Roll Out等),發現這步真的是好棋,
所以就下了這步棋。
2.
Redmond問:
即使人類下的機率這麼低,阿法狗還是選擇這樣下了,
表示人類選擇怎麼下的機率不會影響到阿法狗嗎?
Silver回:
人類下一步怎麼下的機率,只是在最開始的時候,提供阿法狗一些搜尋的初始選項,
實際會怎麼下還是要依靠阿法狗自己後續的評估結果。
(咩按:所以阿法狗有點像是依靠人類的過去下過的棋步,
來捨棄一些根本不需要考慮的位置,所以初手大元還是有可能的(誤))
3.
Garlock問:
阿法狗幾歲?(咩按:這問題...)
Silver回:
兩歲。(咩按:開始講一些古,台灣之光AlphaGo的臉,黃士傑,巴拉巴拉)
去年發表論文,發現光練習古人的譜,不用做任何計算,AI就可以有業餘段位水準,
整個很吃驚。所以就覺得很有希望,跑去找CEO談談,結果就開了projetc,
找了很多人進來,成就了阿法狗跟這場世紀之戰。
4.
Redmond問:
阿法狗打敗了世界冠軍,有人說你們有針對李世石做軟體上的調整,
但剛剛聽你講起來發現好像不太可能?
Silver回:
阿法狗是用幾十萬份的棋譜去訓練出來的,李世石的譜在數量上相比起來,
就好像把一滴水丟到大海裡一樣,
不太可能顯著的去影響阿法狗的棋風,而且阿法狗還有很多自我對局的強化學習。
對我來講,我們很難調整阿法狗去針對李世石,
相反的,李世石是一個很棒的棋手,
他比我們還更可能去適應阿法狗的棋風。(咩按:其實還挺有道理的)
而且只針對一個棋手去調整,其實還蠻危險的。
我們的設計目標很簡單,就是設計一個程式來讓勝利的機率最大化。
我們在比賽前我們還中止了阿法狗的發展進程,讓我們可以順利測試,
所以在比賽過程中,程式的版本其實是沒有改變的。
5.
Redmond問:
你覺得像五路肩沖這種神奇棋步,有可能會持續出現嗎?
Silver回:
我們在比賽中學到很多,從像你這樣的解說評論與分析等等,
我們選擇李世石也是認為他可以測試到阿法狗的極限,
但其實我們不知道阿法狗會怎麼下。
我們雖然創造它,但這時候也只能站旁邊看它會怎麼下,
不然我現在應該是在努力coding,而不是來接受訪問。
(咩按:AI可以讓你不用再當好人工程師)
6.
Garlock問:
我聽說阿法狗現在好像甚至不需要人類過去的棋譜來輔助?
聽說可以從零開始左右互搏訓練,也太讓人驚訝了吧
Silver回:
目前阿法狗的確是從人類過去的棋譜來學習,
但是從零開始訓練,的確是我們未來的計劃,
或許棋風會變得很不一樣也說不定。
(咩按:最後再說了一些這可能是五百年來最出名的圍棋賽等等...)
--
Tags:
圍棋
All Comments
By Iris
at 2016-03-17T13:27
at 2016-03-17T13:27
By Adele
at 2016-03-20T23:04
at 2016-03-20T23:04
By Kumar
at 2016-03-24T14:22
at 2016-03-24T14:22
By Agnes
at 2016-03-28T14:37
at 2016-03-28T14:37
By Bethany
at 2016-03-31T18:19
at 2016-03-31T18:19
By Rebecca
at 2016-04-04T04:44
at 2016-04-04T04:44
By Genevieve
at 2016-04-05T02:12
at 2016-04-05T02:12
By Megan
at 2016-04-08T07:32
at 2016-04-08T07:32
By Yedda
at 2016-04-12T08:38
at 2016-04-12T08:38
By Connor
at 2016-04-12T18:32
at 2016-04-12T18:32
By Xanthe
at 2016-04-17T17:38
at 2016-04-17T17:38
By Charlotte
at 2016-04-22T12:54
at 2016-04-22T12:54
By Megan
at 2016-04-23T09:51
at 2016-04-23T09:51
By Eartha
at 2016-04-27T22:43
at 2016-04-27T22:43
By Isabella
at 2016-04-29T00:40
at 2016-04-29T00:40
By Frederic
at 2016-05-03T11:20
at 2016-05-03T11:20
By Bethany
at 2016-05-07T14:35
at 2016-05-07T14:35
By Faithe
at 2016-05-08T00:24
at 2016-05-08T00:24
By Agatha
at 2016-05-11T19:58
at 2016-05-11T19:58
By Carol
at 2016-05-14T12:40
at 2016-05-14T12:40
By Candice
at 2016-05-18T04:14
at 2016-05-18T04:14
By Audriana
at 2016-05-20T18:23
at 2016-05-20T18:23
By Wallis
at 2016-05-23T01:51
at 2016-05-23T01:51
By Charlie
at 2016-05-23T20:22
at 2016-05-23T20:22
By Dinah
at 2016-05-24T16:39
at 2016-05-24T16:39
By Caitlin
at 2016-05-25T03:31
at 2016-05-25T03:31
By Franklin
at 2016-05-29T06:06
at 2016-05-29T06:06
By James
at 2016-06-03T05:33
at 2016-06-03T05:33
By Faithe
at 2016-06-03T10:16
at 2016-06-03T10:16
By Xanthe
at 2016-06-03T13:18
at 2016-06-03T13:18
By Lydia
at 2016-06-08T09:08
at 2016-06-08T09:08
By Barb Cronin
at 2016-06-08T10:49
at 2016-06-08T10:49
By Ivy
at 2016-06-08T22:04
at 2016-06-08T22:04
By Sarah
at 2016-06-09T05:42
at 2016-06-09T05:42
By Kristin
at 2016-06-12T07:08
at 2016-06-12T07:08
By Callum
at 2016-06-13T05:54
at 2016-06-13T05:54
By Jack
at 2016-06-15T04:30
at 2016-06-15T04:30
By Hazel
at 2016-06-18T14:00
at 2016-06-18T14:00
By Genevieve
at 2016-06-19T05:25
at 2016-06-19T05:25
By Belly
at 2016-06-22T06:14
at 2016-06-22T06:14
By Barb Cronin
at 2016-06-26T06:05
at 2016-06-26T06:05
By Thomas
at 2016-06-30T11:21
at 2016-06-30T11:21
By Mary
at 2016-07-01T16:25
at 2016-07-01T16:25
By Jacob
at 2016-07-02T01:26
at 2016-07-02T01:26
By Charlotte
at 2016-07-03T00:37
at 2016-07-03T00:37
By Xanthe
at 2016-07-06T04:01
at 2016-07-06T04:01
By Sarah
at 2016-07-08T13:36
at 2016-07-08T13:36
By Victoria
at 2016-07-11T10:14
at 2016-07-11T10:14
By Poppy
at 2016-07-16T03:36
at 2016-07-16T03:36
By Linda
at 2016-07-17T14:16
at 2016-07-17T14:16
Related Posts
從前兩局推測AlphaGo算法的重大進展
By Poppy
at 2016-03-13T04:02
at 2016-03-13T04:02
李世石(黑) - AlphaGo(白) 第三局棋譜
By Leila
at 2016-03-13T02:18
at 2016-03-13T02:18
古力第三盤復盤講解
By Donna
at 2016-03-13T01:25
at 2016-03-13T01:25
如果讓alphago吃的棋譜只到50年前
By Olivia
at 2016-03-13T01:14
at 2016-03-13T01:14
柯潔和阿發狗的結局
By William
at 2016-03-13T01:10
at 2016-03-13T01:10