AlphaZero戰勝將棋與西洋棋最強軟體 - 圍棋

Jacob avatar
By Jacob
at 2017-12-06T20:38

Table of Contents

https://arxiv.org/pdf/1712.01815.pdf

這次論文的標題是:

Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm

從零學棋,

使用相似的神經網路架構,

一樣沒有使用任何人類知識,

4小時打敗西洋棋最強軟體Stockfish,

2小時打敗將棋最強軟體Elmo,

34小時打敗圍棋AlphaGoZero 20blocks 3天版本,

(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),

以MCTS打倒傳統的alpha beta search,

通用於完全訊息遊戲,

又一偉大的突破。

--
Tags: 圍棋

All Comments

Lauren avatar
By Lauren
at 2017-12-09T01:10
一個通用於下棋的AI?
Quanna avatar
By Quanna
at 2017-12-11T12:16
又達到新境界了
Lauren avatar
By Lauren
at 2017-12-12T19:49
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的
(例如跳棋)不知道能否通用過去
Rosalind avatar
By Rosalind
at 2017-12-17T17:17
力王:大家可以回家啦~
Dorothy avatar
By Dorothy
at 2017-12-19T19:56
逆天啦 發展這麼快
Ursula avatar
By Ursula
at 2017-12-23T01:05
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類
Ophelia avatar
By Ophelia
at 2017-12-26T10:37
棋手會有一定勝率
Kyle avatar
By Kyle
at 2017-12-26T15:10
想看阿法零跟赤木茂打麻將
Susan avatar
By Susan
at 2017-12-30T08:17
AlphaGO老師:我是說在座的各位都是__
Andy avatar
By Andy
at 2017-12-31T01:35
已經征服完全訊息遊戲了,希望星海二也會有突破
Eartha avatar
By Eartha
at 2018-01-02T15:11
真的是在座的各位都是哈哈,可以回家啦~~~
Hedy avatar
By Hedy
at 2018-01-03T16:05
多人跟雙人是有很多不同,沒問題就有鬼囉.
Eartha avatar
By Eartha
at 2018-01-04T18:49
這也終結了西洋棋的西西里防禦。
Poppy avatar
By Poppy
at 2018-01-09T10:26
這世界變化太快好累啊
Ethan avatar
By Ethan
at 2018-01-09T19:08
太強了 O o
Blanche avatar
By Blanche
at 2018-01-11T09:35
借轉chess
Necoo avatar
By Necoo
at 2018-01-13T00:06
多人會有問題吧,有人合作或針對都會影響吧
Carol avatar
By Carol
at 2018-01-17T15:53
AlphaZero:我不是說人類而已,我是說連其他程式也都是_
Carol avatar
By Carol
at 2018-01-17T19:46
兩個人的完全訊息遊戲最複雜的應該就圍棋,其他應該都
不是問題了
Barb Cronin avatar
By Barb Cronin
at 2018-01-18T19:21
這樣的話 完全訊息遊戲已經到盡頭了
Mason avatar
By Mason
at 2018-01-23T07:19
說不定世上最後一塊淨土會是麻將 AI與人類打成平手
Sandy avatar
By Sandy
at 2018-01-27T05:45
使用ZERO學習模式是不可能學會星海的,即使用map hack
Hazel avatar
By Hazel
at 2018-01-30T16:25
因為星海的規則和變化數遠遠超過圍棋太多太多了
Odelette avatar
By Odelette
at 2018-01-31T10:27
非完全訊息遊戲人類跟AI互有勝負不奇怪
Xanthe avatar
By Xanthe
at 2018-02-02T09:33
這件事大概可以把所有完全訊息的問題解了...
Isla avatar
By Isla
at 2018-02-04T14:12
為什麼會是麻將?非完全訊息遊戲多如牛毛
Ethan avatar
By Ethan
at 2018-02-09T02:55
德州撲克比麻將難多了吧
Robert avatar
By Robert
at 2018-02-10T00:37
我比較想看它打LOL,個種壓血和反殺XD
Hedwig avatar
By Hedwig
at 2018-02-14T00:16
而且說不定它可以真正演算出最適合的對線角和友方英雄
Kama avatar
By Kama
at 2018-02-16T19:41
期待生物科技或材料的革命性
Kama avatar
By Kama
at 2018-02-21T17:08
非完全訊息難在抽卡機率計算和本身牌組的搭配,麻將、德
Faithe avatar
By Faithe
at 2018-02-24T13:08
州撲克其實比較好解決,星海要模擬人的地方很多,要圖片辨
視,很多非關策略的問題要解決,個人感覺其實難多了!
William avatar
By William
at 2018-02-26T21:30
才剛出一個AlphaGO zero 又再創一個打敗他 我都麻痺了
Kama avatar
By Kama
at 2018-03-01T06:11
就像一開始看超級賽亞人打架好興奮 現在整個眼神死
Skylar Davis avatar
By Skylar Davis
at 2018-03-03T08:10
就如我之前所說的..先血洗其他棋類遊戲的軟體,沒想到只
Andy avatar
By Andy
at 2018-03-05T07:01
花這麼短的時間... (搞不好中國象棋也被KO,只是沒說..)
Olive avatar
By Olive
at 2018-03-07T02:31
中國象棋也同樣適用啊,可能是沒花資源訓練而已
Dorothy avatar
By Dorothy
at 2018-03-08T14:58
老實說 連將棋和西洋棋這種有放回和翻轉的都沒問題了
Elvira avatar
By Elvira
at 2018-03-12T16:42
象棋根本只是小兒科吧
Erin avatar
By Erin
at 2018-03-13T07:43
AlphaGo不要再玩遊戲了啦,學寫程式生一個AlphaGo二代w
Ina avatar
By Ina
at 2018-03-16T05:21
樓樓上說得好!
Odelette avatar
By Odelette
at 2018-03-17T05:02
ALPHAGO : 我要掃蕩各種競技遊戲!!
Yuri avatar
By Yuri
at 2018-03-19T21:11
@Tabrith 會有這個想法大概是不清楚難度跳了多少等級吧XD
Heather avatar
By Heather
at 2018-03-20T09:52
@fossil313 沒記錯的話將棋評估的複雜度是比中國象棋高的
Audriana avatar
By Audriana
at 2018-03-24T04:39
,將棋能搞定象棋基本上沒啥問題。是說圍棋都搞定了,本來
其他棋類都是複雜度較低的啊XD
Necoo avatar
By Necoo
at 2018-03-26T20:04
基本上寫程式跟下棋在問題類型上就已經有距離了,而且難度
差距可是很大
Ula avatar
By Ula
at 2018-03-31T19:54
德州撲克不是早就被AI打敗了嗎
Megan avatar
By Megan
at 2018-04-05T07:48
雖然自寫程式的研究是有,但其實沒有完全真正從零開始,比
Iris avatar
By Iris
at 2018-04-08T01:57
較像設計架構的感覺。從零開始的話還會扯出額外理解問題跟
Joseph avatar
By Joseph
at 2018-04-11T10:43
解讀結果的問題要解決,難度又比圍棋跳升不少了
Eden avatar
By Eden
at 2018-04-13T12:09
AlphaZero字面不就是從0開始,亂下由碰觸讓ai了解規則,再
由人類修正bug,修練出強到不可思議的棋力!
Charlotte avatar
By Charlotte
at 2018-04-15T09:28
有人類修正bug嗎?
Aaliyah avatar
By Aaliyah
at 2018-04-19T18:05
Alpha go下一版本:Alpha skynet
Gilbert avatar
By Gilbert
at 2018-04-20T15:14
樓上,這個版本沒有go了,這版是AlphaZero了!
Gary avatar
By Gary
at 2018-04-24T08:54
撲克是有限注能達到頂尖,無限注印象中還沒有能到顛峰的
Heather avatar
By Heather
at 2018-04-29T04:02
@ddavid AlphaGo已經強到不像話了給他點挑戰嘛XD
Kama avatar
By Kama
at 2018-04-30T11:42
那個不是跟頂尖高手打啊
Mason avatar
By Mason
at 2018-05-03T22:15
@Tabrith 強到不像話是指棋類而已,亂扯一個不同類問題有
Tom avatar
By Tom
at 2018-05-07T09:47
啥意義?XD
Rosalind avatar
By Rosalind
at 2018-05-11T04:01
F1賽車跟人賽跑也強得不像話啊,所以叫車去跟鳥比飛高嗎XD
Tristan Cohan avatar
By Tristan Cohan
at 2018-05-14T12:39
@HeterCompute TH有世界最大賽事,稱為World Series of
Poker,WSOP
Victoria avatar
By Victoria
at 2018-05-15T18:49
https://goo.gl/PWktDF
Daniel avatar
By Daniel
at 2018-05-19T09:48
其中世界大賽中的主要賽事(Main Event)就是比no-limit
TH
Hamiltion avatar
By Hamiltion
at 2018-05-23T04:09
而能比到Main Event的決賽桌大多都是一時之選了
Candice avatar
By Candice
at 2018-05-27T20:49
而世界上也有許多知名的頂尖Poker選手都在這項賽事有好成
Zora avatar
By Zora
at 2018-05-31T09:34
績,例如Poker界的傳奇之一Doyle Brunson曾在1976和1977連
Joseph avatar
By Joseph
at 2018-06-04T02:09
續兩屆WSOP Main Event靠垃圾手牌非同花10-2逆轉獲勝,傳
奇到自此10-2這手牌直接被用他的名字命名
Caitlin avatar
By Caitlin
at 2018-06-08T00:23
yeah 的確不是叫alphago去學而是要alphago的AI系統學
Thomas avatar
By Thomas
at 2018-06-11T17:16
查了一下 google 已經在別的地方開始做了 (驚
Franklin avatar
By Franklin
at 2018-06-16T00:54
另外有個一般沒接觸TH有可能見過的知名高手是Johnny Chan
Candice avatar
By Candice
at 2018-06-19T17:06
,在麥特戴蒙主演的電影賭王之王(Rounders)中客串演出賭
Callum avatar
By Callum
at 2018-06-21T11:37
王的就是他,事實上也就是演出他自己
Enid avatar
By Enid
at 2018-06-23T07:42
另外在我有空且很迷TH的那陣子最喜歡的職業Poker玩家是
Daniel Negreanu
Robert avatar
By Robert
at 2018-06-27T05:59
撲克AI贏得只是限定100大盲的單挑 一般打的都是六人桌
九人桌 籌碼也是上下波動的
Irma avatar
By Irma
at 2018-06-29T23:59
AI能在主流比賽或現金局都還沒攻克
Sierra Rose avatar
By Sierra Rose
at 2018-07-04T19:32
Poker AI如果攻克現金桌,基本上你就可以拿去玩線上TH做持
Tristan Cohan avatar
By Tristan Cohan
at 2018-07-09T10:34
續賺錢了,就好像如果你研發出預測股價的技術就拿去投入股
市賺錢XD
Doris avatar
By Doris
at 2018-07-12T02:31
另外就是,TH的現金桌跟Tournament的打法也會有所不同,同
Susan avatar
By Susan
at 2018-07-12T12:49
一套訓練出來的AI基本上應該是沒法在這兩種環境共用的
如HanaYukii提到,桌上人數的不同也會影響打法
Damian avatar
By Damian
at 2018-07-12T23:58
順帶一提,上面提到WSOP Main Event的buy-in(參賽費用)
是一個人一萬美金
Faithe avatar
By Faithe
at 2018-07-13T16:20
Poker AI如果夠強線上絕對看到一堆AI在打,畢竟是真錢在賭
Margaret avatar
By Margaret
at 2018-07-14T00:51
順便提一下,master其實沒有跟zero平等較量過
當時zero用的計算力比master拿到的強
Hardy avatar
By Hardy
at 2018-07-17T07:20
去西洋棋論壇看了一下,能對Stockfish無敗真是了不起
的成就,每個棋譜都異常精彩
Belly avatar
By Belly
at 2018-07-17T18:41
德撲的AI已經屌打人類了,之前李開復辦的比賽,卡內基美隆
Margaret avatar
By Margaret
at 2018-07-22T03:10
大學的Libratus樂勝,只是硬體要求有點高
https://www.inside.com.tw/2017/02/03/how-libratus-work
Annie avatar
By Annie
at 2018-07-24T09:08
是有限注,補充一下樓上眾高手的說法
Callum avatar
By Callum
at 2018-07-28T15:11
Libratus就僅限heads up單挑阿
Caitlin avatar
By Caitlin
at 2018-07-31T02:41
單挑比多人桌單純非常多,說服力還不夠
Elma avatar
By Elma
at 2018-08-01T23:23
有限注也比no-limit單純更多。
Hedda avatar
By Hedda
at 2018-08-03T15:18
另外就是,現金桌的職業高手的強項是強在1.懂得分辨出其他
Blanche avatar
By Blanche
at 2018-08-03T23:30
的高手並且避開,找出魚並坐在那一桌,2.判讀其他人臨場的
Lauren avatar
By Lauren
at 2018-08-08T17:34
情緒跟打法變化。大多是只打heads-up train不出來的東西
Charlotte avatar
By Charlotte
at 2018-08-13T14:56
AI要真的能打多個打多人桌而且決定入座或離桌,長期+EV會
Ula avatar
By Ula
at 2018-08-17T21:53
比較稱得上攻克現金桌XD 至於tournament又是另一個課題。
Blanche avatar
By Blanche
at 2018-08-20T18:24
話說看文章裡面寫說是玩no-limit
Queena avatar
By Queena
at 2018-08-20T22:16
https://goo.gl/AQukJd wiki也寫是針對no-limit
Damian avatar
By Damian
at 2018-08-24T02:42
所以現在alphazero策略上訓練已經超凡入聖了,接下來要克
Lily avatar
By Lily
at 2018-08-28T15:28
服的就是非關策略上,理解、圖片辨識,諸多擬人上的問題了
Erin avatar
By Erin
at 2018-09-02T02:25
就算要說超凡入聖也只是針對容易模擬並評估結果的雙人對抗
資訊公開類別的問題就是了,跳問題種類要研究的事情還多呢
Ethan avatar
By Ethan
at 2018-09-04T03:37
圍棋那邊的確有爭議,要不alphazero至少要挑戰40天版本
Harry avatar
By Harry
at 2018-09-06T07:00
40 block的alphago Zero,畢竟用了5000個TPU..
Madame avatar
By Madame
at 2018-09-09T07:53
不好意思!我就是抱著狗咬狗看好戲的心態,看有沒有機會
Eartha avatar
By Eartha
at 2018-09-10T01:03
elo破6000,或讓李世石版本4子還完勝之類的!

羽生善治奪取龍王 達成永世七冠壯舉

Annie avatar
By Annie
at 2017-12-05T16:14
https://www.shogi.or.jp/news/2017/12/post_1622.html?mi=rlt_player 羽生善治(47歲)於12月5日第30期龍王戰第五局中,擊敗渡邊明龍王,以四勝 一敗成績奪回龍王位,同時也獲得了永世七冠的資格。 羽生本次獲得龍王位,滿足通算7期條件, ...

『活動』賽事共享,棋魂買單

Selena avatar
By Selena
at 2017-11-30T20:10
這手筆比我想的大不少~ 不好意思說發瘋了 給個讚 !! 『活動』賽事共享,棋魂買單 『棋魂』為台灣圍棋發展盡一份心力!即日起參與『棋魂』官方網站認可之賽事,最高可 達100%報名費全額補助,官方指定賽事若獲得現金獎項『棋魂』直接再發一次同等獎金! 活動辦法如下: ◎『棋魂』認可賽事 政府機關核准設立之圍 ...

關鍵逆轉!台灣棋士謝依旻奪回女流本因坊

Harry avatar
By Harry
at 2017-11-30T20:00
關鍵逆轉!台灣棋士謝依旻奪回「女流本因坊」頭銜 2017-11-29 21:46 http://news.ltn.com.tw/news/life/breakingnews/2268862 〔即時新聞/綜合報導〕台灣旅日棋士謝依旻今天(29日)在「女流本因坊」爭奪戰中, 逆轉拿下最後的第5盤,成功奪回女流本 ...

littlegolem 37路棋

Poppy avatar
By Poppy
at 2017-11-26T14:51
好久沒有發過文了....(汗) 自從上班後 就沒時間看實況 棋站下棋的時間 也沒了 因某次在版上看到littlegolem 註冊下了幾場後 從此定居wwwwww 一天回一手或二天回一手棋 悠閒悠閒的對局 因此想來小推廣一下 littlegolem上有各種的GAME 圍棋是其中一項 最近又了中國軍棋(剛剛才 ...

台灣版本棋魂正式上線

Dinah avatar
By Dinah
at 2017-11-26T00:17
※ 引述《nanlong (懶龍)》之銘言: : ※ 引述《nanlong (懶龍)》之銘言: : : 登入時在左方 選用你 註冊的 e-mail ( = 通行證) : : 例如 adsxxxatseed.net.tw .... : : 短期間還有一些地方要測試修改~ : : 註冊網頁如下 : : http: ...