AlphaGO棋風定型的可能性 - 圍棋

Table of Contents

以AlphaGo訓練的方式來說
他是以RL(reinforcement learning)
的方式去訓練結構的參數
就我的理解 每次下完一盤(步)棋都會
依照不同的結果給的獎勵值 去調整參數
因此alphaGo會不會在這三場棋後
變成更能適應小李的下棋模式 甚至是
專門對付他的棋風(local minimum)而不是下出全局最佳解呢?
感覺小李或越戰越辛苦 改變既有的下棋方式會不會贏呢?

--
Sent from my Android

--

All Comments

Kyle avatarKyle2016-03-17
他前兩盤變啦 沒用 這盤變回來 更慘
Kama avatarKama2016-03-18
她跟小李下三盤 跟自己下幾百萬盤你覺得這三盤有影響嗎
Erin avatarErin2016-03-19
他現在不一定在training phase, 可能不會改參數
Yedda avatarYedda2016-03-21
據了解不會,他只會不斷變強
Skylar DavisLinda avatarSkylar DavisLinda2016-03-21
沒可能,因為三盤的量實在太少,他每天至少能自我對局一
百萬盤,請算算看3/1,000,000會造成多大影響。
Eden avatarEden2016-03-23
理論上它應該不會針對對手進行演算法的調整
Aaliyah avatarAaliyah2016-03-26
說不定吧 單機版都贏得了分散式版 代表不是沒有機會
Adele avatarAdele2016-03-27
不會 這三盤跟插花一樣 他每天自我對戰一百萬局耶
Rosalind avatarRosalind2016-03-30
微乎其微
更何況沒輸代表原本的知識已經夠用了
Sarah avatarSarah2016-03-31
大概就每天下一百萬局中其中對手弱弱的一局
Hedwig avatarHedwig2016-04-02
但是如果 輸入棋譜的阿法購VS自練起家的阿法購 打千萬盤
Iris avatarIris2016-04-02
說實在的 AI現在根本不知道跟他對下的是誰 等到有一天
Robert avatarRobert2016-04-04
你下輸他,應該不會列入參考吧! 我想
Catherine avatarCatherine2016-04-05
當他有一個性質迥異的對手 陪他打個千萬盤 可能出棋楓
Frederica avatarFrederica2016-04-10
AI知道對面是誰那才恐怖
Callum avatarCallum2016-04-10
有天AlphaGO刻意走出第一局對戰棋型 彷彿在問:是你嗎?
天啊 想到就毛毛的
Mason avatarMason2016-04-13
自我training跟實戰調整的參數應該會不一樣吧
Hazel avatarHazel2016-04-14
正常的話 實戰中根本不會 training, 回去再手動做較好
我記得 Aja 好像有提到 這次用的網路參數和去年底一樣
Edith avatarEdith2016-04-19
所以這三場以來一面戰鬥一面學習只是個幻想而已
Robert avatarRobert2016-04-22
所以alphaGO只自我對弈到去年底而已?
Una avatarUna2016-04-27
訓練的結果只是一堆數字, 可以任意抽換不同版本
Zora avatarZora2016-04-28
這三盤他屌贏兩盤(應該吧) 你覺得他值得為這種內容改變
下法嗎?
Annie avatarAnnie2016-05-02
我想要換成純 AlphaGo 對奕棋譜重新訓練 也有研究意味在
Eartha avatarEartha2016-05-02
訓練完可以拿兩種版本互相對奕 看看棋力是不是真有增強
Sierra Rose avatarSierra Rose2016-05-04
拜託請再造一台純AlphaGO 不要刪目前這台的檔啊QAQ
James avatarJames2016-05-06
所以google還沒拿出最近的參數出來…,太扯了
Vanessa avatarVanessa2016-05-07
其實是整個棋盤掌握力 狗狗力勝全職棋
當你發現狗狗走出大損還樂勝 代表實力差距之大
Daph Bay avatarDaph Bay2016-05-12
AG:連續好幾天幾百萬盤,卻來5盤慢棋且好弱的對手?
Kumar avatarKumar2016-05-13
birdy590請問有印象Aja哪裡提到嗎,意思是其實這次的跟
1月底的paper差不多呀..
Eartha avatarEartha2016-05-16
期待純 AlphaGo 打破過去大家認為有用的定石
Aaliyah avatarAaliyah2016-05-18
下面rgx網友的文章裡陳經是說這次的AlphaGo強非常多,
Rachel avatarRachel2016-05-21
(跟去年底的比起來)從ELO看起來也是如此,作者(之一)
Puput avatarPuput2016-05-23
Silver也是表示到賽前某段時間(?)有持續自我訓練