為什麼現在AlphaGO開始會"讓"呢? - 圍棋
By Harry
at 2017-05-23T20:22
at 2017-05-23T20:22
Table of Contents
這問題從第一次人機戰開始就不停有人問,我來認真解釋一下好了
其實推文也有人講到重點了
大家已經知道電腦看的是勝率了,這是根本原因沒錯
但這勝率是怎樣來的才是重點
簡單說AlphoGo有兩個系統
一個可以靠當下就猜出大概每步棋的價值(可以簡單想成勝率)
另一個就是,反正我就選一步,然後自己左右互搏下他個上千盤,看勝率多少就好
目前v25版本的第一個系統到底有多準
還有這兩個系統現在互相比重佔了幾成
在官方公布前不知道
我們就簡單先拿容易理解的第二系統來說
就會知道AlphaGo到底在"讓"什麼鬼了
現在假想一個情境:AlphaGo執白,棋局已到中後盤全局無弱棋,領先5目半
但這"領先5目半"從人類的角度來看的
電腦看到什麼呢?他只看到"我怎麼下勝率都接近100%"
那假如現在有10個可能的選點
其中最好的一手(不損目)的只有1種
損1目、損2目、損3目的各三種
AlphaGo把每一種都試一次之後結果會發現,啊怎麼好像都一樣啊?(勝率都接近100%)
於是只剩一些微小的模擬隨機誤差來決定他想選哪個
簡單說等於他就是隨便選了一個,當然選中最佳解的機率是不高的
所以雖然人類角度看起來他就是在損、在讓
但在電腦的角度這叫做"我就真的不知道哪個比較好啊?看起來不都一模一樣嗎?"
當然,這絕對是不影響最終勝負的
因為假如電腦不幸選了損3目的棋,現在上帝視角來看盤面只領先2目半了
下一次同樣看到10的選點,一樣的價值分布
他會發現,不損目、損1目、損2目的勝率都一樣,接近100%,但損3目的勝率只有30%
他很自然就會在前三種可能性隨機挑一個,但絕不會挑到會輸的那種
如此隨機的挑著挑著,由於每次最佳解被挑到的機率,一定小於其他解
最後結果就是會變成只贏一點點,但他就是會贏
這其實是很有趣的一個地方
因為”思考方式”的不同造成互相不理解
就像電腦也會覺得人類布局的棋非常詭異(假如電腦有感情的話)
明明我試了一千次就發現A下法勝率比B下法高5百分點
你為什麼還是選A,你是故意在讓我嗎?
他就無法理解人類真的就是沒辦法看出A、B哪個選點比較好
就只是靠感覺隨便選了一個而已
--
其實推文也有人講到重點了
大家已經知道電腦看的是勝率了,這是根本原因沒錯
但這勝率是怎樣來的才是重點
簡單說AlphoGo有兩個系統
一個可以靠當下就猜出大概每步棋的價值(可以簡單想成勝率)
另一個就是,反正我就選一步,然後自己左右互搏下他個上千盤,看勝率多少就好
目前v25版本的第一個系統到底有多準
還有這兩個系統現在互相比重佔了幾成
在官方公布前不知道
我們就簡單先拿容易理解的第二系統來說
就會知道AlphaGo到底在"讓"什麼鬼了
現在假想一個情境:AlphaGo執白,棋局已到中後盤全局無弱棋,領先5目半
但這"領先5目半"從人類的角度來看的
電腦看到什麼呢?他只看到"我怎麼下勝率都接近100%"
那假如現在有10個可能的選點
其中最好的一手(不損目)的只有1種
損1目、損2目、損3目的各三種
AlphaGo把每一種都試一次之後結果會發現,啊怎麼好像都一樣啊?(勝率都接近100%)
於是只剩一些微小的模擬隨機誤差來決定他想選哪個
簡單說等於他就是隨便選了一個,當然選中最佳解的機率是不高的
所以雖然人類角度看起來他就是在損、在讓
但在電腦的角度這叫做"我就真的不知道哪個比較好啊?看起來不都一模一樣嗎?"
當然,這絕對是不影響最終勝負的
因為假如電腦不幸選了損3目的棋,現在上帝視角來看盤面只領先2目半了
下一次同樣看到10的選點,一樣的價值分布
他會發現,不損目、損1目、損2目的勝率都一樣,接近100%,但損3目的勝率只有30%
他很自然就會在前三種可能性隨機挑一個,但絕不會挑到會輸的那種
如此隨機的挑著挑著,由於每次最佳解被挑到的機率,一定小於其他解
最後結果就是會變成只贏一點點,但他就是會贏
這其實是很有趣的一個地方
因為”思考方式”的不同造成互相不理解
就像電腦也會覺得人類布局的棋非常詭異(假如電腦有感情的話)
明明我試了一千次就發現A下法勝率比B下法高5百分點
你為什麼還是選A,你是故意在讓我嗎?
他就無法理解人類真的就是沒辦法看出A、B哪個選點比較好
就只是靠感覺隨便選了一個而已
--
Tags:
圍棋
All Comments
By Yuri
at 2017-05-24T00:01
at 2017-05-24T00:01
By Una
at 2017-05-25T05:05
at 2017-05-25T05:05
By Edward Lewis
at 2017-05-27T01:19
at 2017-05-27T01:19
By Callum
at 2017-05-28T20:34
at 2017-05-28T20:34
By Christine
at 2017-06-01T08:15
at 2017-06-01T08:15
By Ophelia
at 2017-06-04T09:23
at 2017-06-04T09:23
By Kelly
at 2017-06-05T07:39
at 2017-06-05T07:39
By Blanche
at 2017-06-07T02:10
at 2017-06-07T02:10
By Rosalind
at 2017-06-10T00:51
at 2017-06-10T00:51
By Callum
at 2017-06-11T16:00
at 2017-06-11T16:00
By Blanche
at 2017-06-12T15:00
at 2017-06-12T15:00
By Oscar
at 2017-06-15T05:52
at 2017-06-15T05:52
By Zanna
at 2017-06-15T19:54
at 2017-06-15T19:54
By Donna
at 2017-06-20T11:52
at 2017-06-20T11:52
By Annie
at 2017-06-25T01:15
at 2017-06-25T01:15
By Adele
at 2017-06-26T00:52
at 2017-06-26T00:52
By John
at 2017-06-30T14:13
at 2017-06-30T14:13
By Oliver
at 2017-07-04T01:28
at 2017-07-04T01:28
By Charlie
at 2017-07-06T12:49
at 2017-07-06T12:49
By Oliver
at 2017-07-06T14:25
at 2017-07-06T14:25
By Frederica
at 2017-07-11T02:19
at 2017-07-11T02:19
By Donna
at 2017-07-14T18:54
at 2017-07-14T18:54
By Ivy
at 2017-07-16T00:36
at 2017-07-16T00:36
By Olive
at 2017-07-17T21:33
at 2017-07-17T21:33
By Hedy
at 2017-07-21T00:22
at 2017-07-21T00:22
By Eartha
at 2017-07-22T07:33
at 2017-07-22T07:33
By Victoria
at 2017-07-25T19:18
at 2017-07-25T19:18
By Hedda
at 2017-07-26T01:27
at 2017-07-26T01:27
Related Posts
柯潔(黑) - AlphaGo(白) 第一局棋譜
By Edith
at 2017-05-23T17:03
at 2017-05-23T17:03
可能比李世石還慘 柯潔對弈AlphaGo被看衰
By Kyle
at 2017-05-23T16:56
at 2017-05-23T16:56
聶衛平:AlphaGo收發自如柯潔不知不覺中
By Agatha
at 2017-05-23T16:45
at 2017-05-23T16:45
史上最快的人機大戰第二季第一盤講解
By Joe
at 2017-05-23T16:35
at 2017-05-23T16:35
剛剛的人機對局
By Robert
at 2017-05-23T16:35
at 2017-05-23T16:35