為什麼現在AlphaGO開始會"讓"呢? - 圍棋
By Anonymous
at 2017-05-24T06:48
at 2017-05-24T06:48
Table of Contents
大家好,我是幾日棋迷,十年程式迷
我的理解和BBSealion大有點類似,不過稍做修正
※ 引述《BBSealion (Peaceful Warrior)》之銘言:
: 大家已經知道電腦看的是勝率了,這是根本原因沒錯
: 但這勝率是怎樣來的才是重點
: 簡單說AlphoGo有兩個系統
: 一個可以靠當下就猜出大概每步棋的價值(可以簡單想成勝率)
: 另一個就是,反正我就選一步,然後自己左右互搏下他個上千盤,看勝率多少就好
: 電腦看到什麼呢?他只看到"我怎麼下勝率都接近100%"
這段部分稍做修正,直接打比喻是:
如果你現在突然手上有三個麵包,吃下三個麵包會讓你很爽
人類可能會選擇是,通通吃下去,潮爽der,我吃了三個你沒有~
但電腦是基於長久、通盤考量(也就是對整體位來存活率最高)的選擇
所以會選擇把多出來的麵包冰起來,做為明天早、午餐
尤其在自我對弈上千、上萬次後,更加深這個神經網路的權重
所以對神經網路來說,在過去幾萬次對弈後,計算穩贏3目、但2目是多餘的
它會選擇在其他地方布局讓未來更穩
以至於看起來像是在"讓",實際上是為了整體的勝率
不知道這樣的比喻洽不洽當QQ 還請小力鞭
--
我的理解和BBSealion大有點類似,不過稍做修正
※ 引述《BBSealion (Peaceful Warrior)》之銘言:
: 大家已經知道電腦看的是勝率了,這是根本原因沒錯
: 但這勝率是怎樣來的才是重點
: 簡單說AlphoGo有兩個系統
: 一個可以靠當下就猜出大概每步棋的價值(可以簡單想成勝率)
: 另一個就是,反正我就選一步,然後自己左右互搏下他個上千盤,看勝率多少就好
: 電腦看到什麼呢?他只看到"我怎麼下勝率都接近100%"
這段部分稍做修正,直接打比喻是:
如果你現在突然手上有三個麵包,吃下三個麵包會讓你很爽
人類可能會選擇是,通通吃下去,潮爽der,我吃了三個你沒有~
但電腦是基於長久、通盤考量(也就是對整體位來存活率最高)的選擇
所以會選擇把多出來的麵包冰起來,做為明天早、午餐
尤其在自我對弈上千、上萬次後,更加深這個神經網路的權重
所以對神經網路來說,在過去幾萬次對弈後,計算穩贏3目、但2目是多餘的
它會選擇在其他地方布局讓未來更穩
以至於看起來像是在"讓",實際上是為了整體的勝率
不知道這樣的比喻洽不洽當QQ 還請小力鞭
--
Tags:
圍棋
All Comments
By Anthony
at 2017-05-28T03:53
at 2017-05-28T03:53
By Aaliyah
at 2017-06-02T03:15
at 2017-06-02T03:15
By Brianna
at 2017-06-03T18:39
at 2017-06-03T18:39
By Erin
at 2017-06-06T02:51
at 2017-06-06T02:51
By Hazel
at 2017-06-10T23:16
at 2017-06-10T23:16
Related Posts
人機大戰第二季第一局 柯潔 VS AlphaGo
By Dinah
at 2017-05-24T05:14
at 2017-05-24T05:14
AlphaGo擊敗柯潔 李世石:正如預期
By Madame
at 2017-05-23T23:11
at 2017-05-23T23:11
柯潔還剩一絕招沒用 這也是全人類最後一
By Kumar
at 2017-05-23T22:45
at 2017-05-23T22:45
人機大戰第二盤棋預測抽獎活動
By Callum
at 2017-05-23T22:10
at 2017-05-23T22:10
賽後訪問
By Hedy
at 2017-05-23T21:55
at 2017-05-23T21:55