AlphaZero戰勝將棋與西洋棋最強軟體 - 將棋

Irma avatar
By Irma
at 2017-12-07T00:15

Table of Contents

※ [本文轉錄自 GO 看板 #1Q9-Ito- ]

作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017

https://arxiv.org/pdf/1712.01815.pdf

這次論文的標題是:

Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm

從零學棋,

使用相似的神經網路架構,

一樣沒有使用任何人類知識,

4小時打敗西洋棋最強軟體Stockfish,

2小時打敗將棋最強軟體Elmo,

34小時打敗圍棋AlphaGoZero 20blocks 3天版本,

(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),

以MCTS打倒傳統的alpha beta search,

通用於完全訊息遊戲,

又一偉大的突破。

--

All Comments

Bethany avatar
By Bethany
at 2017-12-08T21:08
一個通用於下棋的AI?
Hazel avatar
By Hazel
at 2017-12-10T18:01
又達到新境界了
Ivy avatar
By Ivy
at 2017-12-12T14:54
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的
(例如跳棋)不知道能否通用過去
Kelly avatar
By Kelly
at 2017-12-14T11:46
力王:大家可以回家啦~
Jack avatar
By Jack
at 2017-12-16T08:39
逆天啦 發展這麼快
Valerie avatar
By Valerie
at 2017-12-18T05:32
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類
Carol avatar
By Carol
at 2017-12-20T02:25
棋手會有一定勝率
Brianna avatar
By Brianna
at 2017-12-21T23:17
想看阿法零跟赤木茂打麻將
Heather avatar
By Heather
at 2017-12-23T20:10
AlphaGO老師:我是說在座的各位都是__
Carol avatar
By Carol
at 2017-12-25T17:03
已經征服完全訊息遊戲了,希望星海二也會有突破
Ivy avatar
By Ivy
at 2017-12-27T13:56
真的是在座的各位都是哈哈,可以回家啦~~~
Barb Cronin avatar
By Barb Cronin
at 2017-12-29T10:49
多人跟雙人是有很多不同,沒問題就有鬼囉.
Valerie avatar
By Valerie
at 2017-12-31T07:41
這也終結了西洋棋的西西里防禦。
Ivy avatar
By Ivy
at 2018-01-02T04:34
這世界變化太快好累啊
Freda avatar
By Freda
at 2018-01-04T01:27
太強了 O o
Barb Cronin avatar
By Barb Cronin
at 2018-01-05T22:20
借轉chess
Harry avatar
By Harry
at 2018-01-07T19:13
雖然演算法很強,但是真的有資源能玩更是關鍵...
Caroline avatar
By Caroline
at 2018-01-09T16:05
不知道在電王的規則下多強就是了
Damian avatar
By Damian
at 2018-01-11T12:58
應該差不多強 耗資源的部分是訓練
Kristin avatar
By Kristin
at 2018-01-13T09:51
實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧?
Damian avatar
By Damian
at 2018-01-15T06:44
64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強
Hamiltion avatar
By Hamiltion
at 2018-01-17T03:36
請他們明年到電王戰比一次就知道了,現在的elmo也不是
最強,而且大家有被限制統一硬體規格
Blanche avatar
By Blanche
at 2018-01-19T00:29
跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k
感覺應該是沒什麼懸念了
Yedda avatar
By Yedda
at 2018-01-20T21:22
在一個node上要做的evaluation不同,不能比NPS吧
Michael avatar
By Michael
at 2018-01-22T18:15
AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑
Andy avatar
By Andy
at 2018-01-24T15:08
要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度
Elizabeth avatar
By Elizabeth
at 2018-01-26T12:00
後來測試最新tanuki確實是比elmo強
Tristan Cohan avatar
By Tristan Cohan
at 2018-01-28T08:53
新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd
因為預測的太短視 剛上直播時常常只預測下一步 昨天看時
好一點 可是在畫面上有預測後9步的空間 却完美的只預設了
8步空一格...
Kumar avatar
By Kumar
at 2018-01-30T05:46
那是UI和探索引擎配合的問題吧

AlphaZero戰勝將棋與西洋棋最強軟體

Jacob avatar
By Jacob
at 2017-12-06T20:38
https://arxiv.org/pdf/1712.01815.pdf 這次論文的標題是: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm 從零學棋, 使用相似的神經網路架構 ...

羽生善治奪取龍王 達成永世七冠壯舉

Liam avatar
By Liam
at 2017-12-05T16:14
https://www.shogi.or.jp/news/2017/12/post_1622.html?mi=rlt_player 羽生善治(47歲)於12月5日第30期龍王戰第五局中,擊敗渡邊明龍王,以四勝 一敗成績奪回龍王位,同時也獲得了永世七冠的資格。 羽生本次獲得龍王位,滿足通算7期條件, ...

第22屆三星盃決賽 唐韋星九段 v.s. 辜梓豪五段

Genevieve avatar
By Genevieve
at 2017-12-05T11:23
棋賽名稱:第22屆三星盃 棋  士:唐韋星九段 v.s. 辜梓豪五段 開賽時間:10:00 地  點:韓國京畿道高陽市 用  時:每方2小時,5次1分鐘讀秒 決賽第一局:2017/12/5 唐韋星九段(B) v.s. 辜梓豪五段(W) 結果:黑中盤勝,唐韋星九段先下一城。 決賽第二局:2017/12/6 ...

AlphaGo對聶衛平道場開放教學工具

Adele avatar
By Adele
at 2017-12-04T14:32
http://live.sina.com.cn/zt/l/v/sports/gotalent/?qq-pf-to=pcqq.group 如題,具體怎麼樣還不確定, https://i.imgur.com/tBzl4Uz.png https://i.imgur.com/i8gegWB.png 上面兩張圖 ...

高雄可以下棋的地方或社團?

Edith avatar
By Edith
at 2017-12-02T10:14
請問 高雄的中央公園現在下午還有沒有開放下棋? 或者是棋社 學校社團 之類 可以對弈的地方 有棋友可以提供資訊嗎? 有搜尋過版上關於高雄的資訊 大多都是推薦中央公園 部分有開放下棋的圍棋教室已遷址 故想更新一下資訊 - ...