AlphaGo Zero,新版本的AlphaGo - 圍棋

Daniel avatar
By Daniel
at 2017-10-19T01:36

Table of Contents

https://www.youtube.com/watch?v=tXlM99xPQC8
https://www.youtube.com/watch?v=WXHFqTvfFSw
https://deepmind.com/blog/alphago-zero-learning-scratch/

新的AlphaGo Zero,是完全沒有受人類棋譜影響的AlphaGo,

訓練3天,以勝率100%打敗了AlphaGo 李世石版本,

21天,達到了Master版本(柯潔)的水準,

並且在訓練40天之後,對Master版本勝率90%,

論文也登在Nature。

https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
--
Tags: 圍棋

All Comments

Genevieve avatar
By Genevieve
at 2017-10-23T19:01
...終於要神乎其技了嗎?
Sandy avatar
By Sandy
at 2017-10-26T20:14
訓練三天後完封李世石版, 最後對柯潔版 100 場贏 89
Robert avatar
By Robert
at 2017-10-29T06:37
演算法也變了.. 全靠自己訓練果然比人手動干預更強
Tracy avatar
By Tracy
at 2017-10-30T14:07
Re:從零開始的下棋生活
Rebecca avatar
By Rebecca
at 2017-11-01T22:16
policy/value network 合併, 不再使用 rollout~
看看其它圍棋軟體多快會跟進
David avatar
By David
at 2017-11-04T21:54
這個進展有點快啊
Oliver avatar
By Oliver
at 2017-11-05T18:52
連結第二個是這個吧?
https://www.youtube.com/watch?v=WXHFqTvfFSw
Kyle avatar
By Kyle
at 2017-11-09T17:04
好想看master被虐的棋譜..無法想像master會怎麼被虐
David avatar
By David
at 2017-11-13T18:10
棋譜在Nature論文的補充資料可找到:
https://goo.gl/xx5jbF
Gary avatar
By Gary
at 2017-11-15T20:49
有自戰, 對李世石版本, 及對Master版本的棋譜
Margaret avatar
By Margaret
at 2017-11-18T09:21
上帝降臨了...
Barb Cronin avatar
By Barb Cronin
at 2017-11-19T01:39
快速打完了Zero對Master,佈局大概就兩種,開局前20手
Hedy avatar
By Hedy
at 2017-11-23T12:02
左右都長一樣,和先前55盤自戰多樣的佈局不同
不知道是不是因為是掛在論文下的關係特別選的
Zora avatar
By Zora
at 2017-11-23T20:55
但是Zero的自戰又不一樣了,多數二連星對二連星
Brianna avatar
By Brianna
at 2017-11-24T10:48
但也有少數不是的,然後看到Zero對Master都沒出現的小
目一間跳守角
Gary avatar
By Gary
at 2017-11-25T23:14
那個自戰,好像只有40block資料夾的最後一盤是完全體
Mason avatar
By Mason
at 2017-11-27T21:36
前面19盤似乎是各個階段的自戰
Edith avatar
By Edith
at 2017-12-04T08:02
有新的系列影片上傳了 ZERO 對決 MASTER
Steve avatar
By Steve
at 2017-12-07T15:25
天網要出現了XD
Steve avatar
By Steve
at 2017-12-09T03:55
《第一天下圍棋就上手》~AlphaGoZero著
Brianna avatar
By Brianna
at 2017-12-13T14:13
Aaliyah avatar
By Aaliyah
at 2017-12-18T13:15
右上那個定石不是黑棋自己挑的嗎xd
Valerie avatar
By Valerie
at 2017-12-20T10:00
是說Alphago要不要開放讓棋手練習這樣
John avatar
By John
at 2017-12-24T17:48
感覺Zero的下法比較淳樸 沒有像master那麼震撼
Edith avatar
By Edith
at 2017-12-26T07:38
圍棋上帝...
Ida avatar
By Ida
at 2017-12-30T22:16
唯有deepmind才能打敗deepmind 騰訊做那麼久也沒啥進步 sc
ientist 跟 engineer的差別
Callum avatar
By Callum
at 2018-01-02T20:08
真是厲害
Edith avatar
By Edith
at 2018-01-02T22:20
科學家或工程師又不相衝突...明明是開創者與追隨者
Iris avatar
By Iris
at 2018-01-04T19:14
的差別
Sandy avatar
By Sandy
at 2018-01-05T11:13
終於來了!
Yuri avatar
By Yuri
at 2018-01-08T05:38
崩潰
William avatar
By William
at 2018-01-15T03:24
真的是神了…
Caitlin avatar
By Caitlin
at 2018-01-18T07:47
前面的自戰棋譜人類棋手都還沒研究完,結果又有新的了@@
Kelly avatar
By Kelly
at 2018-01-19T22:12
........我還以為他們團隊去做別的計畫,怎麼這妖怪還能
進化啊Orz
Emma avatar
By Emma
at 2018-01-24T09:10
反普歸真
Elma avatar
By Elma
at 2018-01-28T00:34
之前就做了 現在跑資料
Elvira avatar
By Elvira
at 2018-02-01T21:14
這四月多就寫好了啊
Tracy avatar
By Tracy
at 2018-02-02T05:47
投nature審稿也要審個幾個月八
Gary avatar
By Gary
at 2018-02-03T08:18
alphago繼續這樣下去 圍棋會有唯一解
Thomas avatar
By Thomas
at 2018-02-04T23:18
到時就會有記憶派棋手出現了
Freda avatar
By Freda
at 2018-02-06T15:26
唯一解還早,而且貼目數也有影響
Kyle avatar
By Kyle
at 2018-02-09T05:45
不覺得圍棋會有唯一解,只有當前局面最好的一手
Necoo avatar
By Necoo
at 2018-02-09T22:00
貼目影響應該爆大
Adele avatar
By Adele
at 2018-02-10T12:13
我想,Zero就證明了這點
Valerie avatar
By Valerie
at 2018-02-11T15:53
有唯一解也不見得記的住...對手又不會跟你一起下最佳解
Hedy avatar
By Hedy
at 2018-02-13T16:07
還要把所有變化都記住才算唯一解
Iris avatar
By Iris
at 2018-02-15T01:59
怎會有背最佳解會贏的可能
Hardy avatar
By Hardy
at 2018-02-19T02:06
先把國際象棋的惟一解找出來再來擔心這件事吧 -_-
Caroline avatar
By Caroline
at 2018-02-19T11:41
http://tinyurl.com/y8z2l6db AlphaGo Zero的80局對弈棋譜
Megan avatar
By Megan
at 2018-02-19T19:14
圍棋有唯一解 kenwufederer大你自己講的話實際上邏輯矛盾
Bethany avatar
By Bethany
at 2018-02-22T16:24
你都知道每個局面都有最好一手 那麼一盤局就是從頭到尾
每一步都是一個局面 所以每一步都有最好一手
那麼這不就是在講圍棋有唯一解? 你前後自己矛盾
Hardy avatar
By Hardy
at 2018-02-26T21:30
有唯一解是確定的事
Eden avatar
By Eden
at 2018-02-27T04:08
哪裡矛盾…最好的一手不代表只有這一手…
可能有兩手勝率相同
Franklin avatar
By Franklin
at 2018-03-03T05:26
不是一定唯一啊
Dorothy avatar
By Dorothy
at 2018-03-04T13:45
而且要看貼目
Eartha avatar
By Eartha
at 2018-03-06T10:13
只要有打劫,就不會有唯一解
Callum avatar
By Callum
at 2018-03-08T07:25
而且還要看對手的應法
Jessica avatar
By Jessica
at 2018-03-11T02:29
只有等到能算盡變化的效能出現才有唯一解
不然這種演算法是不會有唯一解的
Sandy avatar
By Sandy
at 2018-03-12T03:15
「只有等到能算盡變化的效能出現才有唯一解」
你自己上面是說「不覺得圍棋會有唯一解」
而不是說「這種演算法是不會有唯一解的」
Dorothy avatar
By Dorothy
at 2018-03-15T05:34
圍棋本來就不可能有唯一解
Gary avatar
By Gary
at 2018-03-19T06:24
原因已經說明了,圍棋規則就是這樣
Margaret avatar
By Margaret
at 2018-03-23T06:33
就算兩個一樣的電腦都一樣有勝負問題
Queena avatar
By Queena
at 2018-03-26T21:58
在沒有Zero,Master是最強
現在Zero出現,超越了Master之後
Lydia avatar
By Lydia
at 2018-03-30T17:22
我就認為當下最佳解是Zero
至於唯一解,是給計算時間一年一步的Zero嗎?
Hazel avatar
By Hazel
at 2018-04-03T22:12
圍棋不是數學,如果你不能理解這個
Margaret avatar
By Margaret
at 2018-04-08T13:45
就繼續堅持有唯一解,不能說你的理念有錯
但必須說在現今圍棋規則下不可能
Bennie avatar
By Bennie
at 2018-04-11T14:27
我說k大,你要不要去唸一下基礎的賽局理論
Genevieve avatar
By Genevieve
at 2018-04-13T22:08
圍棋絕對是數學的一部份
Agnes avatar
By Agnes
at 2018-04-18T05:20
沒有唯一解是規則造成的,不是其他原因
Bennie avatar
By Bennie
at 2018-04-18T23:16
連圍棋是數學的一部分都出來了…
我只是想說明這些勝負規則是人定出來
Tracy avatar
By Tracy
at 2018-04-22T12:09
至於圍棋跟數學的關係,願聞其詳
數學也沒有唯一解,都是目前最佳
Susan avatar
By Susan
at 2018-04-25T04:58
圍棋本質就是賽局啊,賽局在數學上是一門分支
Annie avatar
By Annie
at 2018-04-29T00:31
會覺得唯一解就是因為目前受限的原因
Anthony avatar
By Anthony
at 2018-05-01T17:35
若圍棋不能被數學所描敘,AlphaGo根本就做不出來
Hedda avatar
By Hedda
at 2018-05-03T19:29
OK,圍棋跟數學的關係是我錯了
但我只是想說明圍棋一定有更上層次
Kumar avatar
By Kumar
at 2018-05-04T05:41
如同Master跟Zero一樣
何況他們之間還不是100%的勝率
但原因是因為人類棋譜干擾還是算法改變?
Annie avatar
By Annie
at 2018-05-05T02:59
這點我沒辦法確定,可能連他們工作人員也不能保證
Ula avatar
By Ula
at 2018-05-08T18:58
沒什麼更上層次啦,圍棋之神也就是棵超大的賽局樹而已
Wallis avatar
By Wallis
at 2018-05-10T07:37
圍棋不是拓樸學的一種嗎?廣義來說算是數學吧?
David avatar
By David
at 2018-05-11T16:19
困難點是無法證明我們的更好一手是真正的更好
Elizabeth avatar
By Elizabeth
at 2018-05-16T14:49
圍棋很偉大 但是跟數學比較太渺小了..怎可能不是數學的一環
Megan avatar
By Megan
at 2018-05-17T02:23
圍棋有唯一解可以用策梅洛定理(Zermelo's theorem)來證明
Puput avatar
By Puput
at 2018-05-21T11:21
策梅洛定理:在二人的有限遊戲(即完成遊戲下的步數有限)中
如果雙方皆擁有完全的資訊,並且運氣因素並不牽涉其中
Rosalind avatar
By Rosalind
at 2018-05-23T04:22
那先行或後行者當一必有一方有必勝/必不敗的策略
Delia avatar
By Delia
at 2018-05-24T01:27
圍棋程式是在降低複雜度找最好的近似解,相對於整個樹是更
Ursula avatar
By Ursula
at 2018-05-24T19:23
下層次,本來就不是用這種演算法在求唯一解
Leila avatar
By Leila
at 2018-05-28T23:47
AG:0 不知道pair go還有沒有幫助
Ethan avatar
By Ethan
at 2018-05-31T17:21
RL的演算法只是在Approximate最佳解而已吧
Carolina Franco avatar
By Carolina Franco
at 2018-06-01T22:40
我想最佳解是存在 只是幾乎求不出來 也無法證明已求出
Jack avatar
By Jack
at 2018-06-05T01:37
星位被點三三 Zero給的答案是立四子搶先拆邊
Una avatar
By Una
at 2018-06-08T05:29
小飛被尖衝直接手拔 大概又要開始被模仿一陣子了
Ingrid avatar
By Ingrid
at 2018-06-11T19:26
必勝必敗跟唯一解可差多了
Harry avatar
By Harry
at 2018-06-12T12:27
圍棋本質基本上跟井字遊戲沒有任何不同 只是它的變
化是天文數字 在上帝或計算力非常高智慧體眼中也不過
是一盤無聊的井字遊戲
Tristan Cohan avatar
By Tristan Cohan
at 2018-06-15T02:18
在固定貼目下, 黑棋或白棋或必勝的策略, 但這不等同於唯一
Brianna avatar
By Brianna
at 2018-06-16T00:40
假設黑棋是必勝好了,也不是在361位置中只有一個位置必勝
Kristin avatar
By Kristin
at 2018-06-20T20:29
除去對稱性,黑棋必勝的第一手不一定只有一個
Kristin avatar
By Kristin
at 2018-06-23T14:12
它就簡單的有最強應手 能讓你輸最少(或羸最多)只是
最強應手會有很多很多
Callum avatar
By Callum
at 2018-06-26T07:08
即使以勝多少來當標準,也可能有好幾個第一手可以勝最多
Candice avatar
By Candice
at 2018-06-26T10:59
Tlhen 説法正確
Caitlin avatar
By Caitlin
at 2018-07-01T00:59
另外,我對於完全沒用到人類圍棋知識,我是很懷疑.之後找時
間去看看論文
Damian avatar
By Damian
at 2018-07-01T04:23
之所以會懷疑,是有點訝異人類的三三定石,Alphazero也這樣
Franklin avatar
By Franklin
at 2018-07-03T13:14
去下.那些定石真的有到完美?或是不完美,但alpha-zero也剛
好找到這樣當它的最佳解?
Callum avatar
By Callum
at 2018-07-06T15:23
演算法好的話 沒必要用到人類知識 這沒什麼好懷疑的
人類知識也一樣只是人類對局經驗累積而來
Agnes avatar
By Agnes
at 2018-07-07T12:20
假設人第一手下星位 神第一手也下星位 不能說神是抄
人的 也不能説人類經驗很重要 真理總是殊途同歸 只是
神跟alpha go 更接近真理 走得更遠
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2018-07-07T23:59
是真的沒用到人類知識,起始都是徹底隨機的. 唯一用到
的是圍棋的旋轉鏡像對稱性. 其實master版跟0版就只差
在master版有先用kgs棋局訓練過,而master版究竟訓練
了多久論文裡也沒講. 蠻好奇同樣訓練60天會是誰強
Jacob avatar
By Jacob
at 2018-07-11T14:46
某些基本定石一定也會有 基本上神來也是這樣下 因為
不這麼下鐵虧 除非周圍配置有所不同
Xanthe avatar
By Xanthe
at 2018-07-11T19:56
好奇有多少版友因為AlphaGo開始接觸RL..
Daph Bay avatar
By Daph Bay
at 2018-07-12T06:07
總之圍棋沒有唯一解 但有數不盡的最佳解 即雙方都最
強手 但最強手有很多選擇 但最後勝負差是相同的
Elma avatar
By Elma
at 2018-07-16T01:16
有公布前期棋譜啊 根本隨機亂下
Zanna avatar
By Zanna
at 2018-07-20T06:07
下著下著 人類歸納的很多棋理就慢慢出現了
Joseph avatar
By Joseph
at 2018-07-22T20:23
就我對論文的理解,zero版和master版在演算法上還是有差異的
Noah avatar
By Noah
at 2018-07-25T19:15
可以看做 zero 版在演算法上又做了純粹的強化,以此條件開始
Faithe avatar
By Faithe
at 2018-07-30T10:20
從零開始自我訓練,訓練的強度上升比之前的版本快了很多。
Noah avatar
By Noah
at 2018-08-02T23:20
論文有提到 原本的演算法不適合完自我學習
Gilbert avatar
By Gilbert
at 2018-08-03T21:20
對,因此, zero的版本更適合自我學習
Erin avatar
By Erin
at 2018-08-06T15:39
兩個network合併準確率有下降 但運算簡化有補回來
Adele avatar
By Adele
at 2018-08-07T13:06
結果棋力反而變強 亂猜的rollout也被捨棄
Sarah avatar
By Sarah
at 2018-08-08T03:25
看完只有拜服阿,從強到更強超強爆強的感覺 Orz
Oliver avatar
By Oliver
at 2018-08-11T03:15
一開始愛吃子 慢慢學會圍地和厚勢
Elma avatar
By Elma
at 2018-08-11T11:40
然後一些已知的定式被發現 這時候就已經很強了
Puput avatar
By Puput
at 2018-08-13T02:26
現在可以臭屁,我還可以贏學3小時的 alphago zero , lol
Anthony avatar
By Anthony
at 2018-08-16T17:03
err其實只有差rollout跟feature,前者對訓練的影響是0
後者差13倍但需要耗資源學規律所以很難說哪個比較好
Eden avatar
By Eden
at 2018-08-20T22:21
@tlchen 你只要想一下,人類的定石也不過就是從古至今從對
Margaret avatar
By Margaret
at 2018-08-24T21:57
局或自我研究中累積下來的經驗不斷傳承下來,人類一開始也
是從零出發的
現在AlphaGo Zero不過就是靠高速大量對局在以天計的時間內
Wallis avatar
By Wallis
at 2018-08-28T15:40
排完了人類長久以來的研究得到一樣甚至超前的結果而已
Poppy avatar
By Poppy
at 2018-08-31T15:07
而人類可以自豪的就是,以人類完成一局棋需要那麼久的時間
Iris avatar
By Iris
at 2018-09-04T01:39
,能進化的速度如此之慢,然而AlphaGo還是證明了人類畢竟
Ingrid avatar
By Ingrid
at 2018-09-06T07:54
長久的累積還是對了很多東西。不要因為被AlphaGo超越就開
Jack avatar
By Jack
at 2018-09-09T04:37
始否定人類累積下來的東西,這事實上就只是人類研發出來的
新進化方式超越了人類以前的舊進化方式罷了
Dinah avatar
By Dinah
at 2018-09-09T23:34
不過有看到一種說法,AlphaGO也有inductive bias,只是
Vanessa avatar
By Vanessa
at 2018-09-14T05:26
剛好它的算法跟人類下棋的bias是同一路數,所以有可能某日
Sierra Rose avatar
By Sierra Rose
at 2018-09-17T10:22
來了個外星人用全新的算法避開AlphaGO和人的bias達到更高
Quanna avatar
By Quanna
at 2018-09-18T08:55
可能我太看清人類的能力了.所以,alphao zero所呈現的,我反
Sandy avatar
By Sandy
at 2018-09-18T09:59
境界,也就是說現在Zero自學得出和人類類似的的定式未必能
Zora avatar
By Zora
at 2018-09-23T01:24
證明這些定式就是正確無誤
Ida avatar
By Ida
at 2018-09-23T02:50
而是驚訝人類的成果.至於說 alpha zero 多快就達到多高的
實力. 其實若是從下的局數來看, 而不是以時間來看,它或許
Oliver avatar
By Oliver
at 2018-09-26T03:13
不見得那麼厲害
我當然不是說它不強,它強到沒有辦法去談.只是就學習來說
Daniel avatar
By Daniel
at 2018-09-27T12:38
不該只用時間來說它比人類快
Lydia avatar
By Lydia
at 2018-09-29T03:47
AlphaGo 演算法目標只有一個, 就是要把會贏的方法記下來
Margaret avatar
By Margaret
at 2018-09-29T10:18
它連在棋盤上亂填都沒有排除, 這樣要怎麼說有 bias?
Charlotte avatar
By Charlotte
at 2018-10-02T03:14
個人覺得alphago/zero一定還有死活問題
Robert avatar
By Robert
at 2018-10-04T13:31
master還特別用個反master來消除master的死活問題
Belly avatar
By Belly
at 2018-10-06T06:07
一種自我冥想練功的概念,阿發狗快出來社交,不然會變宅宅
Hazel avatar
By Hazel
at 2018-10-06T11:59
變得多強不是重點,還要下贏人才能稱神
Edith avatar
By Edith
at 2018-10-08T01:57
zero 跟 master 不一樣 沒剩下什麼是人類給它的
Andrew avatar
By Andrew
at 2018-10-11T14:03
Master 處理死活防輸
Andy avatar
By Andy
at 2018-10-16T00:08
master已碾壓全部的人類,沒機會輸,而zero還碾壓master,
Emma avatar
By Emma
at 2018-10-20T22:44
一個神上面還有更高的神的境界,而且進步還沒有結束..
Ingrid avatar
By Ingrid
at 2018-10-24T23:34
七龍珠感

圍棋天地訂閱

Daniel avatar
By Daniel
at 2017-10-16T10:34
大家好: 我想訂閱圍棋的雜誌,以吸引圍棋新知,我 Google/Baidu 得到有限的資訊如下: 1. 圍棋天地品質還不錯,似乎是目前有限的選擇之一。(棋道好像在2000年停刊, 圍棋世界是日文,根據我訂購日本書的經驗,應該也很難訂閱吧,我不知道有沒有 好的英文的圍棋刊物,但目前圍棋似乎是中國最強,買中國 ...

統神在下圍棋

James avatar
By James
at 2017-10-06T19:35
統神感覺還滿有基本概念的 http://www.twitch.tv/asiagodtonegg3be0 無聊可以看一下 - ...

第42期名人戰第4局 高尾紳路(B) v.s. 井山裕太(W)

Regina avatar
By Regina
at 2017-10-02T09:27
棋賽名稱:第42期名人戰第4局 對弈棋士:高尾紳路(B) v.s. 井山裕太(W) 日  期:2017/10/2~3 地  點:日本 石川県小松市 旅亭懐石のとや 用  時:每方用時8小時,剩10分鐘時開始進入1手60秒的讀秒 結  果:164手止,白中盤勝 棋  譜:http://lgs.tw/qukeu8 ...

想買給孩子在家練棋的棋子選購疑問

Quanna avatar
By Quanna
at 2017-09-30T11:44
對象是一名小學三年級已經學了一年棋的孩童 想說家裡沒有棋具 讓他在上圍棋課之餘在家有一套棋具也可以練習 現在目前的想法是 以前自己當小孩時買過文具店的黑白五子棋 那種真的是又扁又輕 很容易被電風扇吹動 或是下子時不小心碰觸移動到其他棋子 所以想購買有加重的棋子 但辜狗過的資訊 重子幾乎都是加鉛 ...

回鍋一些小問題

Tristan Cohan avatar
By Tristan Cohan
at 2017-09-26T11:26
不好意思打擾各位 小弟最後一次認真下棋已經是十五年甚至更久前的事情了,當時是業餘4段,lgs3d 後來因為升學就幾乎只看棋,頂多擺譜,幾乎沒實際再下過(頂多指導一下新手親戚朋友這樣) 定石套路忘的差不多了,自己覺得細算也退步很多 最近生涯規劃差不多定下來了,也比較有空閒 想請教 (1)現在有沒有推薦較快 ...