為什麼現在AlphaGO開始會"讓"呢? - 圍棋

Anonymous · 2017-05-24

Table of Contents

Post
Comments
Related Posts

大家好，我是幾日棋迷，十年程式迷

我的理解和BBSealion大有點類似，不過稍做修正

※ 引述《BBSealion (Peaceful Warrior)》之銘言：
: 大家已經知道電腦看的是勝率了，這是根本原因沒錯
: 但這勝率是怎樣來的才是重點
: 簡單說AlphoGo有兩個系統
: 一個可以靠當下就猜出大概每步棋的價值（可以簡單想成勝率）
: 另一個就是，反正我就選一步，然後自己左右互搏下他個上千盤，看勝率多少就好

: 電腦看到什麼呢？他只看到"我怎麼下勝率都接近100%"

這段部分稍做修正，直接打比喻是：

如果你現在突然手上有三個麵包，吃下三個麵包會讓你很爽

人類可能會選擇是，通通吃下去，潮爽der，我吃了三個你沒有～

但電腦是基於長久、通盤考量(也就是對整體位來存活率最高)的選擇

所以會選擇把多出來的麵包冰起來，做為明天早、午餐

尤其在自我對弈上千、上萬次後，更加深這個神經網路的權重

所以對神經網路來說，在過去幾萬次對弈後，計算穩贏3目、但2目是多餘的

它會選擇在其他地方布局讓未來更穩

以至於看起來像是在"讓"，實際上是為了整體的勝率

不知道這樣的比喻洽不洽當QQ 還請小力鞭

--

圍棋

All Comments

Anthony2017-05-28

程式迷講什麼比喻，來個資料結構吼

Aaliyah2017-06-02

這比喻不太對，因為你沒去拿就是會被對方拿走

Brianna2017-06-03

BBS的說法比較正確

Erin2017-06-06

這比喻不太恰當，因為下棋是你拿一個麵包，對方就會拿走另

Hazel2017-06-10

一個XD 你拿小了對面就會拿大的走

為什麼現在AlphaGO開始會"讓"呢? - 圍棋

All Comments

Related Posts