如題
大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的
那alphago和自己下個幾百萬盤
alphago會不會永遠都選擇變化少的呢?
或者說 變化少的他都下習慣了
變化少的一直打反而勝率一直提高
變化多的很少下反而勝率一直降低
他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢?
自己天生避開劫爭
自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯?
--
大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的
那alphago和自己下個幾百萬盤
alphago會不會永遠都選擇變化少的呢?
或者說 變化少的他都下習慣了
變化少的一直打反而勝率一直提高
變化多的很少下反而勝率一直降低
他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢?
自己天生避開劫爭
自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯?
--
All Comments