再和alphago重覆同一盤棋? - 圍棋
By Hamiltion
at 2016-03-17T01:05
at 2016-03-17T01:05
Table of Contents
※ 引述《Dialysis (Chiquitia)》之銘言:
: 不好意思,有個問題想了好一會兒,實在是不確定答案,
: 想來也只有這個板最合適問。
: 倘若重覆alphago第一盤和李世石的對奕內容,
: 那麼,alphago還會下出一樣的步數嗎?
: 我的直覺告訴我,應該是不一樣,
: 但,到底隨機的機轉及其比重占了多少,實在是不懂如何去思考,
: 請問有人能釋疑?
圍棋的一個盤面其實有八種變形, 對稱 2 種乘上旋轉 0/90/180/270 度 4 種.
完全相同的局面, 只是觀棋的角度不同.
然而把這些盤面變形丟進 Policy/Value Network 得到的值不會完全相同.
把類神經網路設計成遇到變形可以吐出相同的值並不是辦不到,
但會有一些副作用, 像是效果較差或是鑑別不出特殊的對稱棋型.
一個解決的方法是把八種變形都丟進去算取平均, 棋力會更高一點但速度慢很多.
所以 AlphaGo 實戰時是算到某個盤面時隨機取一種變形,
再次算到時再取另一種變形平均, 一個盤面的估算最多是八種變形的平均.
如果這裡的隨機是真隨機而非固定順序,
那麼同樣的盤面還是會有微妙的差異影響後面的應手.
不過我個人認為... 實戰用八倍的 GPU 下去解決比較快, 雖然很耗電 :p
--
: 不好意思,有個問題想了好一會兒,實在是不確定答案,
: 想來也只有這個板最合適問。
: 倘若重覆alphago第一盤和李世石的對奕內容,
: 那麼,alphago還會下出一樣的步數嗎?
: 我的直覺告訴我,應該是不一樣,
: 但,到底隨機的機轉及其比重占了多少,實在是不懂如何去思考,
: 請問有人能釋疑?
圍棋的一個盤面其實有八種變形, 對稱 2 種乘上旋轉 0/90/180/270 度 4 種.
完全相同的局面, 只是觀棋的角度不同.
然而把這些盤面變形丟進 Policy/Value Network 得到的值不會完全相同.
把類神經網路設計成遇到變形可以吐出相同的值並不是辦不到,
但會有一些副作用, 像是效果較差或是鑑別不出特殊的對稱棋型.
一個解決的方法是把八種變形都丟進去算取平均, 棋力會更高一點但速度慢很多.
所以 AlphaGo 實戰時是算到某個盤面時隨機取一種變形,
再次算到時再取另一種變形平均, 一個盤面的估算最多是八種變形的平均.
如果這裡的隨機是真隨機而非固定順序,
那麼同樣的盤面還是會有微妙的差異影響後面的應手.
不過我個人認為... 實戰用八倍的 GPU 下去解決比較快, 雖然很耗電 :p
--
Tags:
圍棋
All Comments
By Harry
at 2016-03-21T10:56
at 2016-03-21T10:56
By Harry
at 2016-03-22T02:35
at 2016-03-22T02:35
By Margaret
at 2016-03-22T13:51
at 2016-03-22T13:51
By Damian
at 2016-03-26T00:24
at 2016-03-26T00:24
By Barb Cronin
at 2016-03-26T07:40
at 2016-03-26T07:40
By Sandy
at 2016-03-30T13:39
at 2016-03-30T13:39
By Wallis
at 2016-04-02T15:01
at 2016-04-02T15:01
By Skylar Davis
at 2016-04-02T22:44
at 2016-04-02T22:44
By George
at 2016-04-07T15:58
at 2016-04-07T15:58
Related Posts
李世石九段攜妻女前往濟州島度假
By James
at 2016-03-16T22:59
at 2016-03-16T22:59
Alpha第五戰有無解說
By Leila
at 2016-03-16T22:40
at 2016-03-16T22:40
柯潔稱AlphaGo獨立人格 棋風似自己盼對決
By Dora
at 2016-03-16T21:02
at 2016-03-16T21:02
柯潔稱AlphaGo有獨立人格 棋風似自己盼對
By Daph Bay
at 2016-03-16T20:11
at 2016-03-16T20:11
李世石:與AlphaGo的對決此生難忘
By Anthony
at 2016-03-16T19:57
at 2016-03-16T19:57