AlphaGO棋風定型的可能性 - 圍棋

Jake · 2016-03-12

Table of Contents

Post
Comments
Related Posts

以AlphaGo訓練的方式來說
他是以RL(reinforcement learning)
的方式去訓練結構的參數
就我的理解每次下完一盤(步)棋都會
依照不同的結果給的獎勵值去調整參數
因此alphaGo會不會在這三場棋後
變成更能適應小李的下棋模式甚至是
專門對付他的棋風(local minimum)而不是下出全局最佳解呢？
感覺小李或越戰越辛苦改變既有的下棋方式會不會贏呢？

--
Sent from my Android

--

All Comments

Kyle2016-03-17

他前兩盤變啦沒用這盤變回來更慘

Kama2016-03-18

她跟小李下三盤跟自己下幾百萬盤你覺得這三盤有影響嗎

Erin2016-03-19

他現在不一定在training phase, 可能不會改參數

Yedda2016-03-21

據了解不會，他只會不斷變強

Skylar DavisLinda2016-03-21

沒可能，因為三盤的量實在太少，他每天至少能自我對局一
百萬盤，請算算看3/1,000,000會造成多大影響。

Eden2016-03-23

理論上它應該不會針對對手進行演算法的調整

Aaliyah2016-03-26

說不定吧單機版都贏得了分散式版代表不是沒有機會

Adele2016-03-27

不會這三盤跟插花一樣他每天自我對戰一百萬局耶

Rosalind2016-03-30

微乎其微
更何況沒輸代表原本的知識已經夠用了

Sarah2016-03-31

大概就每天下一百萬局中其中對手弱弱的一局

Hedwig2016-04-02

但是如果輸入棋譜的阿法購VS自練起家的阿法購打千萬盤

Iris2016-04-02

說實在的 AI現在根本不知道跟他對下的是誰等到有一天

Robert2016-04-04

你下輸他，應該不會列入參考吧！我想

Catherine2016-04-05

當他有一個性質迥異的對手陪他打個千萬盤可能出棋楓

Frederica2016-04-10

AI知道對面是誰那才恐怖

Callum2016-04-10

有天AlphaGO刻意走出第一局對戰棋型彷彿在問:是你嗎?
天啊想到就毛毛的

Mason2016-04-13

自我training跟實戰調整的參數應該會不一樣吧

Hazel2016-04-14

正常的話實戰中根本不會 training, 回去再手動做較好
我記得 Aja 好像有提到這次用的網路參數和去年底一樣

Edith2016-04-19

所以這三場以來一面戰鬥一面學習只是個幻想而已

Robert2016-04-22

所以alphaGO只自我對弈到去年底而已？

Una2016-04-27

訓練的結果只是一堆數字, 可以任意抽換不同版本

Zora2016-04-28

這三盤他屌贏兩盤(應該吧) 你覺得他值得為這種內容改變
下法嗎？

Annie2016-05-02

我想要換成純 AlphaGo 對奕棋譜重新訓練也有研究意味在

Eartha2016-05-02

訓練完可以拿兩種版本互相對奕看看棋力是不是真有增強

Sierra Rose2016-05-04

拜託請再造一台純AlphaGO 不要刪目前這台的檔啊QAQ

James2016-05-06

所以google還沒拿出最近的參數出來…，太扯了

Vanessa2016-05-07

其實是整個棋盤掌握力狗狗力勝全職棋
當你發現狗狗走出大損還樂勝代表實力差距之大

Daph Bay2016-05-12

AG:連續好幾天幾百萬盤,卻來5盤慢棋且好弱的對手?

Kumar2016-05-13

birdy590請問有印象Aja哪裡提到嗎，意思是其實這次的跟
1月底的paper差不多呀..

Eartha2016-05-16

期待純 AlphaGo 打破過去大家認為有用的定石

Aaliyah2016-05-18

下面rgx網友的文章裡陳經是說這次的AlphaGo強非常多，

Rachel2016-05-21

(跟去年底的比起來)從ELO看起來也是如此，作者(之一)

Puput2016-05-23

Silver也是表示到賽前某段時間(?)有持續自我訓練