AlphaZero戰勝將棋與西洋棋最強軟體 - 圍棋

Table of Contents

https://arxiv.org/pdf/1712.01815.pdf

這次論文的標題是:

Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm

從零學棋,

使用相似的神經網路架構,

一樣沒有使用任何人類知識,

4小時打敗西洋棋最強軟體Stockfish,

2小時打敗將棋最強軟體Elmo,

34小時打敗圍棋AlphaGoZero 20blocks 3天版本,

(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),

以MCTS打倒傳統的alpha beta search,

通用於完全訊息遊戲,

又一偉大的突破。

--

All Comments

Lauren avatarLauren2017-12-09
一個通用於下棋的AI?
Quanna avatarQuanna2017-12-11
又達到新境界了
Lauren avatarLauren2017-12-12
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的
(例如跳棋)不知道能否通用過去
Rosalind avatarRosalind2017-12-17
力王:大家可以回家啦~
Dorothy avatarDorothy2017-12-19
逆天啦 發展這麼快
Ursula avatarUrsula2017-12-23
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類
Ophelia avatarOphelia2017-12-26
棋手會有一定勝率
Kyle avatarKyle2017-12-26
想看阿法零跟赤木茂打麻將
Susan avatarSusan2017-12-30
AlphaGO老師:我是說在座的各位都是__
Andy avatarAndy2017-12-31
已經征服完全訊息遊戲了,希望星海二也會有突破
Eartha avatarEartha2018-01-02
真的是在座的各位都是哈哈,可以回家啦~~~
Hedy avatarHedy2018-01-03
多人跟雙人是有很多不同,沒問題就有鬼囉.
Eartha avatarEartha2018-01-04
這也終結了西洋棋的西西里防禦。
Poppy avatarPoppy2018-01-09
這世界變化太快好累啊
Ethan avatarEthan2018-01-09
太強了 O o
Blanche avatarBlanche2018-01-11
借轉chess
Necoo avatarNecoo2018-01-13
多人會有問題吧,有人合作或針對都會影響吧
Carol avatarCarol2018-01-17
AlphaZero:我不是說人類而已,我是說連其他程式也都是_
Carol avatarCarol2018-01-17
兩個人的完全訊息遊戲最複雜的應該就圍棋,其他應該都
不是問題了
Barb Cronin avatarBarb Cronin2018-01-18
這樣的話 完全訊息遊戲已經到盡頭了
Mason avatarMason2018-01-23
說不定世上最後一塊淨土會是麻將 AI與人類打成平手
Sandy avatarSandy2018-01-27
使用ZERO學習模式是不可能學會星海的,即使用map hack
Hazel avatarHazel2018-01-30
因為星海的規則和變化數遠遠超過圍棋太多太多了
Odelette avatarOdelette2018-01-31
非完全訊息遊戲人類跟AI互有勝負不奇怪
Xanthe avatarXanthe2018-02-02
這件事大概可以把所有完全訊息的問題解了...
Isla avatarIsla2018-02-04
為什麼會是麻將?非完全訊息遊戲多如牛毛
Ethan avatarEthan2018-02-09
德州撲克比麻將難多了吧
Robert avatarRobert2018-02-10
我比較想看它打LOL,個種壓血和反殺XD
Hedwig avatarHedwig2018-02-14
而且說不定它可以真正演算出最適合的對線角和友方英雄
Kama avatarKama2018-02-16
期待生物科技或材料的革命性
Kama avatarKama2018-02-21
非完全訊息難在抽卡機率計算和本身牌組的搭配,麻將、德
Faithe avatarFaithe2018-02-24
州撲克其實比較好解決,星海要模擬人的地方很多,要圖片辨
視,很多非關策略的問題要解決,個人感覺其實難多了!
William avatarWilliam2018-02-26
才剛出一個AlphaGO zero 又再創一個打敗他 我都麻痺了
Kama avatarKama2018-03-01
就像一開始看超級賽亞人打架好興奮 現在整個眼神死
Skylar Davis avatarSkylar Davis2018-03-03
就如我之前所說的..先血洗其他棋類遊戲的軟體,沒想到只
Andy avatarAndy2018-03-05
花這麼短的時間... (搞不好中國象棋也被KO,只是沒說..)
Olive avatarOlive2018-03-07
中國象棋也同樣適用啊,可能是沒花資源訓練而已
Dorothy avatarDorothy2018-03-08
老實說 連將棋和西洋棋這種有放回和翻轉的都沒問題了
Elvira avatarElvira2018-03-12
象棋根本只是小兒科吧
Erin avatarErin2018-03-13
AlphaGo不要再玩遊戲了啦,學寫程式生一個AlphaGo二代w
Ina avatarIna2018-03-16
樓樓上說得好!
Odelette avatarOdelette2018-03-17
ALPHAGO : 我要掃蕩各種競技遊戲!!
Yuri avatarYuri2018-03-19
@Tabrith 會有這個想法大概是不清楚難度跳了多少等級吧XD
Heather avatarHeather2018-03-20
@fossil313 沒記錯的話將棋評估的複雜度是比中國象棋高的
Audriana avatarAudriana2018-03-24
,將棋能搞定象棋基本上沒啥問題。是說圍棋都搞定了,本來
其他棋類都是複雜度較低的啊XD
Necoo avatarNecoo2018-03-26
基本上寫程式跟下棋在問題類型上就已經有距離了,而且難度
差距可是很大
Ula avatarUla2018-03-31
德州撲克不是早就被AI打敗了嗎
Megan avatarMegan2018-04-05
雖然自寫程式的研究是有,但其實沒有完全真正從零開始,比
Iris avatarIris2018-04-08
較像設計架構的感覺。從零開始的話還會扯出額外理解問題跟
Joseph avatarJoseph2018-04-11
解讀結果的問題要解決,難度又比圍棋跳升不少了
Eden avatarEden2018-04-13
AlphaZero字面不就是從0開始,亂下由碰觸讓ai了解規則,再
由人類修正bug,修練出強到不可思議的棋力!
Charlotte avatarCharlotte2018-04-15
有人類修正bug嗎?
Aaliyah avatarAaliyah2018-04-19
Alpha go下一版本:Alpha skynet
Gilbert avatarGilbert2018-04-20
樓上,這個版本沒有go了,這版是AlphaZero了!
Gary avatarGary2018-04-24
撲克是有限注能達到頂尖,無限注印象中還沒有能到顛峰的
Heather avatarHeather2018-04-29
@ddavid AlphaGo已經強到不像話了給他點挑戰嘛XD
Kama avatarKama2018-04-30
那個不是跟頂尖高手打啊
Mason avatarMason2018-05-03
@Tabrith 強到不像話是指棋類而已,亂扯一個不同類問題有
Tom avatarTom2018-05-07
啥意義?XD
Rosalind avatarRosalind2018-05-11
F1賽車跟人賽跑也強得不像話啊,所以叫車去跟鳥比飛高嗎XD
Tristan Cohan avatarTristan Cohan2018-05-14
@HeterCompute TH有世界最大賽事,稱為World Series of
Poker,WSOP
Victoria avatarVictoria2018-05-15
Daniel avatarDaniel2018-05-19
其中世界大賽中的主要賽事(Main Event)就是比no-limit
TH
Hamiltion avatarHamiltion2018-05-23
而能比到Main Event的決賽桌大多都是一時之選了
Candice avatarCandice2018-05-27
而世界上也有許多知名的頂尖Poker選手都在這項賽事有好成
Zora avatarZora2018-05-31
績,例如Poker界的傳奇之一Doyle Brunson曾在1976和1977連
Joseph avatarJoseph2018-06-04
續兩屆WSOP Main Event靠垃圾手牌非同花10-2逆轉獲勝,傳
奇到自此10-2這手牌直接被用他的名字命名
Caitlin avatarCaitlin2018-06-08
yeah 的確不是叫alphago去學而是要alphago的AI系統學
Thomas avatarThomas2018-06-11
查了一下 google 已經在別的地方開始做了 (驚
Franklin avatarFranklin2018-06-16
另外有個一般沒接觸TH有可能見過的知名高手是Johnny Chan
Candice avatarCandice2018-06-19
,在麥特戴蒙主演的電影賭王之王(Rounders)中客串演出賭
Callum avatarCallum2018-06-21
王的就是他,事實上也就是演出他自己
Enid avatarEnid2018-06-23
另外在我有空且很迷TH的那陣子最喜歡的職業Poker玩家是
Daniel Negreanu
Robert avatarRobert2018-06-27
撲克AI贏得只是限定100大盲的單挑 一般打的都是六人桌
九人桌 籌碼也是上下波動的
Irma avatarIrma2018-06-29
AI能在主流比賽或現金局都還沒攻克
Sierra Rose avatarSierra Rose2018-07-04
Poker AI如果攻克現金桌,基本上你就可以拿去玩線上TH做持
Tristan Cohan avatarTristan Cohan2018-07-09
續賺錢了,就好像如果你研發出預測股價的技術就拿去投入股
市賺錢XD
Doris avatarDoris2018-07-12
另外就是,TH的現金桌跟Tournament的打法也會有所不同,同
Susan avatarSusan2018-07-12
一套訓練出來的AI基本上應該是沒法在這兩種環境共用的
如HanaYukii提到,桌上人數的不同也會影響打法
Damian avatarDamian2018-07-12
順帶一提,上面提到WSOP Main Event的buy-in(參賽費用)
是一個人一萬美金
Faithe avatarFaithe2018-07-13
Poker AI如果夠強線上絕對看到一堆AI在打,畢竟是真錢在賭
Margaret avatarMargaret2018-07-14
順便提一下,master其實沒有跟zero平等較量過
當時zero用的計算力比master拿到的強
Hardy avatarHardy2018-07-17
去西洋棋論壇看了一下,能對Stockfish無敗真是了不起
的成就,每個棋譜都異常精彩
Belly avatarBelly2018-07-17
德撲的AI已經屌打人類了,之前李開復辦的比賽,卡內基美隆
Margaret avatarMargaret2018-07-22
大學的Libratus樂勝,只是硬體要求有點高
https://www.inside.com.tw/2017/02/03/how-libratus-work
Annie avatarAnnie2018-07-24
是有限注,補充一下樓上眾高手的說法
Callum avatarCallum2018-07-28
Libratus就僅限heads up單挑阿
Caitlin avatarCaitlin2018-07-31
單挑比多人桌單純非常多,說服力還不夠
Elma avatarElma2018-08-01
有限注也比no-limit單純更多。
Hedda avatarHedda2018-08-03
另外就是,現金桌的職業高手的強項是強在1.懂得分辨出其他
Blanche avatarBlanche2018-08-03
的高手並且避開,找出魚並坐在那一桌,2.判讀其他人臨場的
Lauren avatarLauren2018-08-08
情緒跟打法變化。大多是只打heads-up train不出來的東西
Charlotte avatarCharlotte2018-08-13
AI要真的能打多個打多人桌而且決定入座或離桌,長期+EV會
Ula avatarUla2018-08-17
比較稱得上攻克現金桌XD 至於tournament又是另一個課題。
Blanche avatarBlanche2018-08-20
話說看文章裡面寫說是玩no-limit
Queena avatarQueena2018-08-20
https://goo.gl/AQukJd wiki也寫是針對no-limit
Damian avatarDamian2018-08-24
所以現在alphazero策略上訓練已經超凡入聖了,接下來要克
Lily avatarLily2018-08-28
服的就是非關策略上,理解、圖片辨識,諸多擬人上的問題了
Erin avatarErin2018-09-02
就算要說超凡入聖也只是針對容易模擬並評估結果的雙人對抗
資訊公開類別的問題就是了,跳問題種類要研究的事情還多呢
Ethan avatarEthan2018-09-04
圍棋那邊的確有爭議,要不alphazero至少要挑戰40天版本
Harry avatarHarry2018-09-06
40 block的alphago Zero,畢竟用了5000個TPU..
Madame avatarMadame2018-09-09
不好意思!我就是抱著狗咬狗看好戲的心態,看有沒有機會
Eartha avatarEartha2018-09-10
elo破6000,或讓李世石版本4子還完勝之類的!