為什麼現在AlphaGO開始會"讓"呢? - 圍棋

By Harry
at 2017-05-23T20:22

Table of Contents

這問題從第一次人機戰開始就不停有人問，我來認真解釋一下好了
其實推文也有人講到重點了

大家已經知道電腦看的是勝率了，這是根本原因沒錯
但這勝率是怎樣來的才是重點

簡單說AlphoGo有兩個系統
一個可以靠當下就猜出大概每步棋的價值（可以簡單想成勝率）
另一個就是，反正我就選一步，然後自己左右互搏下他個上千盤，看勝率多少就好

目前v25版本的第一個系統到底有多準
還有這兩個系統現在互相比重佔了幾成
在官方公布前不知道
我們就簡單先拿容易理解的第二系統來說
就會知道AlphaGo到底在"讓"什麼鬼了

現在假想一個情境：AlphaGo執白，棋局已到中後盤全局無弱棋，領先5目半
但這"領先5目半"從人類的角度來看的
電腦看到什麼呢？他只看到"我怎麼下勝率都接近100%"

那假如現在有10個可能的選點
其中最好的一手（不損目）的只有1種
損1目、損2目、損3目的各三種

AlphaGo把每一種都試一次之後結果會發現，啊怎麼好像都一樣啊？（勝率都接近100%)
於是只剩一些微小的模擬隨機誤差來決定他想選哪個
簡單說等於他就是隨便選了一個，當然選中最佳解的機率是不高的

所以雖然人類角度看起來他就是在損、在讓
但在電腦的角度這叫做"我就真的不知道哪個比較好啊？看起來不都一模一樣嗎？"

當然，這絕對是不影響最終勝負的
因為假如電腦不幸選了損3目的棋，現在上帝視角來看盤面只領先2目半了
下一次同樣看到10的選點，一樣的價值分布
他會發現，不損目、損1目、損2目的勝率都一樣，接近100%，但損3目的勝率只有30%
他很自然就會在前三種可能性隨機挑一個，但絕不會挑到會輸的那種

如此隨機的挑著挑著，由於每次最佳解被挑到的機率，一定小於其他解
最後結果就是會變成只贏一點點，但他就是會贏

這其實是很有趣的一個地方
因為”思考方式”的不同造成互相不理解
就像電腦也會覺得人類布局的棋非常詭異（假如電腦有感情的話）
明明我試了一千次就發現A下法勝率比B下法高5百分點
你為什麼還是選A，你是故意在讓我嗎？
他就無法理解人類真的就是沒辦法看出A、B哪個選點比較好
就只是靠感覺隨便選了一個而已

--

All Comments

By Yuri
at 2017-05-24T00:01

現在盤勢分析，看到阿發狗開始讓，就知道這盤勝負已定..

By Una
at 2017-05-25T05:05

更精確的說就是他發現每步勝率都差不多（接近100%)
所以選到最佳解的機率開始下滑

By Edward Lewis
at 2017-05-27T01:19

局勢差不多的時候，最佳跟次佳解的勝率差距一定很大
那他就一定會走到最佳解

By Callum
at 2017-05-28T20:34

所以只有在均勢的時候才能逼出ai的實力也才會造成計算
負擔那時對電腦限時才有意義

By Christine
at 2017-06-01T08:15

奇怪，那為何不能設計穩贏的時候再追求最多領地?

By Ophelia
at 2017-06-04T09:23

而且alphaGo下緩的時候真的判斷100%贏了嗎?應該還沒吧

By Kelly
at 2017-06-05T07:39

100%是好理解的講法，精確說就是勝率起伏不大了

By Blanche
at 2017-06-07T02:10

因為目數多寡跟勝負不是完全正相關的為了降低演算法的負擔

By Rosalind
at 2017-06-10T00:51

應該還有另外一種可能: 虧的走法真的勝率比較高

By Callum
at 2017-06-11T16:00

這個應該能解釋中盤放緩，不是指尾盤可以算盡的時候

By Blanche
at 2017-06-12T15:00

有優勢的時候做小虧的交換來取勝說不定勝率真的比較高

By Oscar
at 2017-06-15T05:52

反正贏多贏少都是贏優勢本來就是一種籌碼

By Zanna
at 2017-06-15T19:54

大推，請問文章可轉載於弈棋嗎？謝謝您！

By Donna
at 2017-06-20T11:52

雖然alphaGo選擇勝率高的走但勝率高的不一定是有理的棋
但要讓alphaGo走進盲點必須要那條path深到alphaGo算不到

By Annie
at 2017-06-25T01:15

他能設計穩贏追求更多領地但沒有意義 Deepmind不是圍棋設

By Adele
at 2017-06-26T00:52

計公司他要盡量在「最少規則」下做最多的事情以確保他設
計出來的演算法可以應用在更多領域

By John
at 2017-06-30T14:13

我覺得電腦計算上一定會判斷+-目數公司也知道alphago跟
神一樣了這場跟人類下就真的是指導棋有沒有可能其實中
國棋院早在比賽前枱面下安排妥當了公司賽前對祂輸入指令
：+1/4

By Oliver
at 2017-07-04T01:28

推很有說服力

By Charlie
at 2017-07-06T12:49

今天忘了哪位解說者有講, 對人來說, 優勢越大棋盤越小
所以人會追求多贏

By Oliver
at 2017-07-06T14:25

推原來是這樣啊

By Frederica
at 2017-07-11T02:19

人類感覺的贏到爆勝率也沒接近百分之百，有看過zen6之類
的中盤頂多6-70%，收官也9x%；電腦剪枝加挑穩的下，絕不
是什麼99.x% 跟 99.x％穩贏下哪都沒差。alphago 就是在比
賽結束前逐步往100提升至

By Donna
at 2017-07-14T18:54

你到底有沒有看論文不懂裝懂。。。

By Ivy
at 2017-07-16T00:36

為啥要設計成領先越多目勝率沒越高?

By Olive
at 2017-07-17T21:33

因為用找最大勝利目數來算會有經典的平均數問題
全世界平均一個人一顆睪丸?

By Hedy
at 2017-07-21T00:22

目數高不代表勝率高

By Eartha
at 2017-07-22T07:33

從MCTS的原理來看，贏10目和贏1目對勝率加成都是一樣的

By Victoria
at 2017-07-25T19:18

電腦看勝率不是看贏多少目，而是接下來的N種變化中
出現勝利盤面最多的走法

By Hedda
at 2017-07-26T01:27

有興趣請參考Monte Carlo tree search這是alphago的核心

Related Posts

柯潔(黑) - AlphaGo(白) 第一局棋譜

By Edith
at 2017-05-23T17:03

因為ptt關係，沒辦法在這邊的棋譜打出柯潔全名請見諒另外附上網頁版 http://lgs.tw/q6j97if 若有錯誤再麻煩提醒，謝謝按 z 可進入打譜模式 [ 1]● =andgt; R16 [ 2]○ =andgt; Q4 [ 3]● =andgt; C17 [ 4]○ =an ...

可能比李世石還慘柯潔對弈AlphaGo被看衰

By Kyle
at 2017-05-23T16:56

可能比李世石還慘柯潔對弈AlphaGo被看衰 2017-05-23 16:28世界日報中國新聞組／北京23日電谷歌（Google）人工智慧軟體AlphaGo今天與中國圍棋職業棋士柯潔對弈，外界對柯潔普遍抱悲觀預期，甚至認為，儘管柯潔貴為當今世界第一，但此番人機大戰，柯潔有可能比去年南韓棋王李世石 ...

聶衛平：AlphaGo收發自如柯潔不知不覺中

By Agatha
at 2017-05-23T16:45

聶衛平：AlphaGo收發自如柯潔不知不覺中它道了 5月23日，聶衛平公益指導棋活動在新浪演播室進行。棋聖聶衛平做客新浪演播室，並對今天柯潔與AlphaGo進行的首局人機大戰進行了點評。在本局終局階段，在執黑的柯潔頑強追趕下，AlphaGo的優勢逐漸縮小，聶老判斷：“我感覺形勢一直是白棋AlphaG ...

史上最快的人機大戰第二季第一盤講解

By Joe
at 2017-05-23T16:35

還沒下完就在錄影片哈哈有興趣了解這盤棋的棋友來看看罡哥錄的影片吧~ https://www.youtube.com/watch?v=TdF4b9UfE9oandamp;t=25s -- Sent from my Windows - ...

剛剛的人機對局

By Robert
at 2017-05-23T16:35

討論看看，我覺得第24手，alphago大飛，太薄了，之後柯潔利用這裡留下的缺陷，打穿下面。柯潔25手有人說方向不對，我覺得還可以，但是拆三有靠近厚勢之嫌，拆二的話就沒有之後的打入了。 26手感覺很奇特，一般是在上邊掛角或割分，沒想到那麼快就打入作戰， 26手大家覺得算 ...