AlphaZero戰勝將棋與西洋棋最強軟體 - 圍棋

Jacob · 2017-12-06

Table of Contents

Post
Comments
Related Posts

https://arxiv.org/pdf/1712.01815.pdf

這次論文的標題是：

Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm

從零學棋，

使用相似的神經網路架構，

一樣沒有使用任何人類知識，

4小時打敗西洋棋最強軟體Stockfish，

2小時打敗將棋最強軟體Elmo，

34小時打敗圍棋AlphaGoZero 20blocks 3天版本，

(圍棋其實有些爭議，因為他這次用了5000TPU，上次AlphaGoZero只用2000TPU)，

以MCTS打倒傳統的alpha beta search，

通用於完全訊息遊戲，

又一偉大的突破。

--

圍棋

All Comments

Lauren2017-12-09

一個通用於下棋的AI？

Quanna2017-12-11

又達到新境界了

Lauren2017-12-12

不知道限制多嚴格，有運氣成分的（例如暗棋）或多人的
（例如跳棋）不知道能否通用過去

Rosalind2017-12-17

力王：大家可以回家啦~

Dorothy2017-12-19

逆天啦發展這麼快

Ursula2017-12-23

暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類

Ophelia2017-12-26

棋手會有一定勝率

Kyle2017-12-26

想看阿法零跟赤木茂打麻將

Susan2017-12-30

AlphaGO老師：我是說在座的各位都是＿＿

Andy2017-12-31

已經征服完全訊息遊戲了，希望星海二也會有突破

Eartha2018-01-02

真的是在座的各位都是哈哈，可以回家啦~~~

Hedy2018-01-03

多人跟雙人是有很多不同,沒問題就有鬼囉.

Eartha2018-01-04

這也終結了西洋棋的西西里防禦。

Poppy2018-01-09

這世界變化太快好累啊

Ethan2018-01-09

太強了 O o

Blanche2018-01-11

借轉chess

Necoo2018-01-13

多人會有問題吧，有人合作或針對都會影響吧

Carol2018-01-17

AlphaZero:我不是說人類而已,我是說連其他程式也都是＿

Carol2018-01-17

兩個人的完全訊息遊戲最複雜的應該就圍棋，其他應該都
不是問題了

Barb Cronin2018-01-18

這樣的話完全訊息遊戲已經到盡頭了

Mason2018-01-23

說不定世上最後一塊淨土會是麻將 AI與人類打成平手

Sandy2018-01-27

使用ZERO學習模式是不可能學會星海的，即使用map hack

Hazel2018-01-30

因為星海的規則和變化數遠遠超過圍棋太多太多了

Odelette2018-01-31

非完全訊息遊戲人類跟AI互有勝負不奇怪

Xanthe2018-02-02

這件事大概可以把所有完全訊息的問題解了...

Isla2018-02-04

為什麼會是麻將？非完全訊息遊戲多如牛毛

Ethan2018-02-09

德州撲克比麻將難多了吧

Robert2018-02-10

我比較想看它打LOL,個種壓血和反殺XD

Hedwig2018-02-14

而且說不定它可以真正演算出最適合的對線角和友方英雄

Kama2018-02-16

期待生物科技或材料的革命性

Kama2018-02-21

非完全訊息難在抽卡機率計算和本身牌組的搭配,麻將、德

Faithe2018-02-24

州撲克其實比較好解決,星海要模擬人的地方很多,要圖片辨
視,很多非關策略的問題要解決,個人感覺其實難多了!

William2018-02-26

才剛出一個AlphaGO zero 又再創一個打敗他我都麻痺了

Kama2018-03-01

就像一開始看超級賽亞人打架好興奮現在整個眼神死

Skylar Davis2018-03-03

就如我之前所說的..先血洗其他棋類遊戲的軟體,沒想到只

Andy2018-03-05

花這麼短的時間... (搞不好中國象棋也被KO,只是沒說..)

Olive2018-03-07

中國象棋也同樣適用啊，可能是沒花資源訓練而已

Dorothy2018-03-08

老實說連將棋和西洋棋這種有放回和翻轉的都沒問題了

Elvira2018-03-12

象棋根本只是小兒科吧

Erin2018-03-13

AlphaGo不要再玩遊戲了啦，學寫程式生一個AlphaGo二代w

Ina2018-03-16

樓樓上說得好!

Odelette2018-03-17

ALPHAGO : 我要掃蕩各種競技遊戲!!

Yuri2018-03-19

@Tabrith 會有這個想法大概是不清楚難度跳了多少等級吧XD

Heather2018-03-20

@fossil313 沒記錯的話將棋評估的複雜度是比中國象棋高的

Audriana2018-03-24

，將棋能搞定象棋基本上沒啥問題。是說圍棋都搞定了，本來
其他棋類都是複雜度較低的啊XD

Necoo2018-03-26

基本上寫程式跟下棋在問題類型上就已經有距離了，而且難度
差距可是很大

Ula2018-03-31

德州撲克不是早就被AI打敗了嗎

Megan2018-04-05

雖然自寫程式的研究是有，但其實沒有完全真正從零開始，比

Iris2018-04-08

較像設計架構的感覺。從零開始的話還會扯出額外理解問題跟

Joseph2018-04-11

解讀結果的問題要解決，難度又比圍棋跳升不少了

Eden2018-04-13

AlphaZero字面不就是從0開始,亂下由碰觸讓ai了解規則,再
由人類修正bug,修練出強到不可思議的棋力!

Charlotte2018-04-15

有人類修正bug嗎？

Aaliyah2018-04-19

Alpha go下一版本:Alpha skynet

Gilbert2018-04-20

樓上,這個版本沒有go了,這版是AlphaZero了!

Gary2018-04-24

撲克是有限注能達到頂尖，無限注印象中還沒有能到顛峰的

Heather2018-04-29

@ddavid AlphaGo已經強到不像話了給他點挑戰嘛XD

Kama2018-04-30

那個不是跟頂尖高手打啊

Mason2018-05-03

@Tabrith 強到不像話是指棋類而已，亂扯一個不同類問題有

Tom2018-05-07

啥意義？XD

Rosalind2018-05-11

F1賽車跟人賽跑也強得不像話啊，所以叫車去跟鳥比飛高嗎XD

Tristan Cohan2018-05-14

@HeterCompute TH有世界最大賽事，稱為World Series of
Poker，WSOP

Victoria2018-05-15

https://goo.gl/PWktDF

Daniel2018-05-19

其中世界大賽中的主要賽事（Main Event）就是比no-limit
TH

Hamiltion2018-05-23

而能比到Main Event的決賽桌大多都是一時之選了

Candice2018-05-27

而世界上也有許多知名的頂尖Poker選手都在這項賽事有好成

Zora2018-05-31

績，例如Poker界的傳奇之一Doyle Brunson曾在1976和1977連

Joseph2018-06-04

續兩屆WSOP Main Event靠垃圾手牌非同花10-2逆轉獲勝，傳
奇到自此10-2這手牌直接被用他的名字命名

Caitlin2018-06-08

yeah 的確不是叫alphago去學而是要alphago的AI系統學

Thomas2018-06-11

查了一下 google 已經在別的地方開始做了 (驚

Franklin2018-06-16

另外有個一般沒接觸TH有可能見過的知名高手是Johnny Chan

Candice2018-06-19

，在麥特戴蒙主演的電影賭王之王（Rounders）中客串演出賭

Callum2018-06-21

王的就是他，事實上也就是演出他自己

Enid2018-06-23

另外在我有空且很迷TH的那陣子最喜歡的職業Poker玩家是
Daniel Negreanu

Robert2018-06-27

撲克AI贏得只是限定100大盲的單挑一般打的都是六人桌
九人桌籌碼也是上下波動的

Irma2018-06-29

AI能在主流比賽或現金局都還沒攻克

Sierra Rose2018-07-04

Poker AI如果攻克現金桌，基本上你就可以拿去玩線上TH做持

Tristan Cohan2018-07-09

續賺錢了，就好像如果你研發出預測股價的技術就拿去投入股
市賺錢XD

Doris2018-07-12

另外就是，TH的現金桌跟Tournament的打法也會有所不同，同

Susan2018-07-12

一套訓練出來的AI基本上應該是沒法在這兩種環境共用的
如HanaYukii提到，桌上人數的不同也會影響打法

Damian2018-07-12

順帶一提，上面提到WSOP Main Event的buy-in（參賽費用）
是一個人一萬美金

Faithe2018-07-13

Poker AI如果夠強線上絕對看到一堆AI在打，畢竟是真錢在賭

Margaret2018-07-14

順便提一下，master其實沒有跟zero平等較量過
當時zero用的計算力比master拿到的強

Hardy2018-07-17

去西洋棋論壇看了一下，能對Stockfish無敗真是了不起
的成就，每個棋譜都異常精彩

Belly2018-07-17

德撲的AI已經屌打人類了，之前李開復辦的比賽，卡內基美隆

Margaret2018-07-22

大學的Libratus樂勝，只是硬體要求有點高
https://www.inside.com.tw/2017/02/03/how-libratus-work

Annie2018-07-24

是有限注，補充一下樓上眾高手的說法

Callum2018-07-28

Libratus就僅限heads up單挑阿

Caitlin2018-07-31

單挑比多人桌單純非常多，說服力還不夠

Elma2018-08-01

有限注也比no-limit單純更多。

Hedda2018-08-03

另外就是，現金桌的職業高手的強項是強在1.懂得分辨出其他

Blanche2018-08-03

的高手並且避開，找出魚並坐在那一桌，2.判讀其他人臨場的

Lauren2018-08-08

情緒跟打法變化。大多是只打heads-up train不出來的東西

Charlotte2018-08-13

AI要真的能打多個打多人桌而且決定入座或離桌，長期+EV會

Ula2018-08-17

比較稱得上攻克現金桌XD 至於tournament又是另一個課題。

Blanche2018-08-20

話說看文章裡面寫說是玩no-limit

Queena2018-08-20

https://goo.gl/AQukJd wiki也寫是針對no-limit

Damian2018-08-24

所以現在alphazero策略上訓練已經超凡入聖了,接下來要克

Lily2018-08-28

服的就是非關策略上,理解、圖片辨識,諸多擬人上的問題了

Erin2018-09-02

就算要說超凡入聖也只是針對容易模擬並評估結果的雙人對抗
資訊公開類別的問題就是了，跳問題種類要研究的事情還多呢

Ethan2018-09-04

圍棋那邊的確有爭議,要不alphazero至少要挑戰40天版本

Harry2018-09-06

40 block的alphago Zero,畢竟用了5000個TPU..

Madame2018-09-09

不好意思!我就是抱著狗咬狗看好戲的心態,看有沒有機會

Eartha2018-09-10

elo破6000,或讓李世石版本4子還完勝之類的!

AlphaZero戰勝將棋與西洋棋最強軟體 - 圍棋

All Comments

Related Posts