alphago避開劫爭 - 圍棋

Table of Contents

如題

大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的

那alphago和自己下個幾百萬盤

alphago會不會永遠都選擇變化少的呢?

或者說 變化少的他都下習慣了

變化少的一直打反而勝率一直提高

變化多的很少下反而勝率一直降低

他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢?

自己天生避開劫爭

自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯?

--

All Comments

Sierra Rose avatarSierra Rose2016-03-15
我是認為如果勝率低於50%,就會陷入只能選低於50%
Delia avatarDelia2016-03-20
的循環,所以越下越糟
Zanna avatarZanna2016-03-21
這種問題誰知道,就等研發團隊測試出來再看看吧
Zanna avatarZanna2016-03-22
不會 除非你讓他認為輸的棋是贏
Dora avatarDora2016-03-24
training data 的 skew 是很基本的概念,不用替專家煩
惱這個啦XD
Elma avatarElma2016-03-25
當汙染率達到400%,AlphaGo將跟人類一起變成柳橙汁
Ina avatarIna2016-03-25
只要勝率不是0,都有可能回升到50%以上
Jake avatarJake2016-03-29
這是有可能的 但不知道純淨的比較強還是棋譜比較強
不過現在可能有大BUG
Rebecca avatarRebecca2016-03-31
機器學習的的overfitting是老問題了
Zanna avatarZanna2016-04-05
被提掉那八目是重點 就是因為阿發狗亂下一子
導致八目死棋