AlphaZero戰勝將棋與西洋棋最強軟體 - 將棋

Table of Contents

※ [本文轉錄自 GO 看板 #1Q9-Ito- ]

作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017

https://arxiv.org/pdf/1712.01815.pdf

這次論文的標題是:

Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm

從零學棋,

使用相似的神經網路架構,

一樣沒有使用任何人類知識,

4小時打敗西洋棋最強軟體Stockfish,

2小時打敗將棋最強軟體Elmo,

34小時打敗圍棋AlphaGoZero 20blocks 3天版本,

(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),

以MCTS打倒傳統的alpha beta search,

通用於完全訊息遊戲,

又一偉大的突破。

--

All Comments

Bethany avatarBethany2017-12-08
一個通用於下棋的AI?
Hazel avatarHazel2017-12-10
又達到新境界了
Ivy avatarIvy2017-12-12
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的
(例如跳棋)不知道能否通用過去
Kelly avatarKelly2017-12-14
力王:大家可以回家啦~
Jack avatarJack2017-12-16
逆天啦 發展這麼快
Valerie avatarValerie2017-12-18
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類
Carol avatarCarol2017-12-20
棋手會有一定勝率
Brianna avatarBrianna2017-12-21
想看阿法零跟赤木茂打麻將
Heather avatarHeather2017-12-23
AlphaGO老師:我是說在座的各位都是__
Carol avatarCarol2017-12-25
已經征服完全訊息遊戲了,希望星海二也會有突破
Ivy avatarIvy2017-12-27
真的是在座的各位都是哈哈,可以回家啦~~~
Barb Cronin avatarBarb Cronin2017-12-29
多人跟雙人是有很多不同,沒問題就有鬼囉.
Valerie avatarValerie2017-12-31
這也終結了西洋棋的西西里防禦。
Ivy avatarIvy2018-01-02
這世界變化太快好累啊
Freda avatarFreda2018-01-04
太強了 O o
Barb Cronin avatarBarb Cronin2018-01-05
借轉chess
Harry avatarHarry2018-01-07
雖然演算法很強,但是真的有資源能玩更是關鍵...
Caroline avatarCaroline2018-01-09
不知道在電王的規則下多強就是了
Damian avatarDamian2018-01-11
應該差不多強 耗資源的部分是訓練
Kristin avatarKristin2018-01-13
實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧?
Damian avatarDamian2018-01-15
64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強
Hamiltion avatarHamiltion2018-01-17
請他們明年到電王戰比一次就知道了,現在的elmo也不是
最強,而且大家有被限制統一硬體規格
Blanche avatarBlanche2018-01-19
跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k
感覺應該是沒什麼懸念了
Yedda avatarYedda2018-01-20
在一個node上要做的evaluation不同,不能比NPS吧
Michael avatarMichael2018-01-22
AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑
Andy avatarAndy2018-01-24
要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度
Elizabeth avatarElizabeth2018-01-26
後來測試最新tanuki確實是比elmo強
Tristan Cohan avatarTristan Cohan2018-01-28
新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd
因為預測的太短視 剛上直播時常常只預測下一步 昨天看時
好一點 可是在畫面上有預測後9步的空間 却完美的只預設了
8步空一格...
Kumar avatarKumar2018-01-30
那是UI和探索引擎配合的問題吧