李世石 VS AlphaGo 第二局看法 - 圍棋

By Anthony
at 2016-03-11T15:56

Table of Contents

看很多不下棋的在那邊放話好像電腦每一步都是對的，覺得可以細想一下程式的原
理，畢竟目前的程式離真理還是有很大的差距的。我也只是個十幾年前的業四，也
不敢說要評棋，但一些簡單好壞應該還是可以講講。

棋類不像POKER、麻將、或撲克牌遊戲是機率遊戲，棋類很多地方是有唯一解的。用
死活詰棋當例子，如果電腦真的只是用機率判斷，勝率最高的那點可能是：
[對手應的若是那唯一解電腦必死，下其他任何點電腦都活，勝率99%]
電腦應該選擇這變化嗎？當然不該！

當然我相信AG程式裡會對必勝必敗的點做排除(不然可能連簡單攻殺都會出錯)，但
我只是強調AG用所謂"最高勝率"判斷落子的策略也正是目前電腦應該還可以被擊敗
的原因。越早期的著手你要用勝敗機率來判斷越是困難，也很好理解為什麼電腦前
期容易出現惡棋。

柯潔講話那麼托大我覺得也是有原因的(當然我覺得他來下也不見得會贏)，就是因
為電腦還是有出現明顯的壞棋。AG有些疑問手有可能是好棋，像11虎完13手拔，或
37尖沖這種過去普遍覺得不太好的，也許事實上並不太虧。
(解釋給X日棋迷：通常13要手拔不會先虎，因為那會把棋下重容易被攻。尖沖通常
認為對方若在3路你尖沖合理，對方在4路你讓人4路圍空通常是虧的，也就是為什
麼評論會認為小李怎樣都該往4路那邊壓而不該實戰往5路壓)
但43黏到61是黑不好的型這應該是沒甚麼爭議的。若實戰李沒有之後幾個緩手讓黑
下到73，而是早一步攻擊那塊弱棋，那應該會是白主動的局面。換個方向想，電腦
中間那坨單官下半天最後還要多花一手73來連回，想也知道不可能好。

因為棋不是機率遊戲，但電腦是用機率來判斷，因此人若能把握這點下出局部最佳
解應是可以在佔些便宜的。

--

Tags: 圍棋

All Comments

By Kyle
at 2016-03-13T03:07

電腦資源不是無限而電腦判斷計算難易的方法也跟人不同
所以可能有部分落子人來看很容易計算出優劣電腦很難
於是對於電腦來講自然該去下別種選擇

By Kelly
at 2016-03-17T01:09

本來就是這樣了電腦又不是神只要有失誤就會輸

By Tom
at 2016-03-20T19:54

電腦每一步大概都只有5成多把握而已強就強再不會失常而

By Daph Bay
at 2016-03-24T17:36

以上優劣說的是局部可以算出絕對優劣的地方.

By George
at 2016-03-27T07:55

來個天才型的高手把把都出妙手電腦自然越下勝率越低
不需要跟電腦拼計算用大局意識跟電腦玩

By Brianna
at 2016-03-28T22:26

真的很多不懂圍棋的在那邊自以為連叫吃是什麼都不知

By Mia
at 2016-04-02T13:25

電腦後面盤面越窄精確率會越高人類只有前期有機會

By Todd Johnson
at 2016-04-07T11:00

你講的就是李喆說的，電腦欠缺邏輯論證的推理

By Noah
at 2016-04-11T23:26

AlphaGO大局觀還是不錯能夠在這上面贏過AlphaGO還
很難說

By Linda
at 2016-04-13T17:14

職業棋士的比賽，如果最後靠對方犯錯獲勝，那也不是值得

By Rachel
at 2016-04-17T05:01

記錄的名局。本來圍棋的勝負就是要全部都是合理應手。

By Andrew
at 2016-04-17T11:30

推中肯!

By Emma
at 2016-04-18T03:38

沒人在懷疑你說的那些地方AG有問題關鍵是中前盤看似不1

By Regina
at 2016-04-19T22:54

好的棋到底有沒有不好另外一方面李喆也推測這種邏輯
上就證明不好的選擇可能隨著局勢越緊張接近而越少會作
出

By Caitlin
at 2016-04-22T00:14

多賺一目的價值會隨著局勢僵持緊張甚至劣勢=而變大

By Madame
at 2016-04-25T07:23

而之後需要負擔的計算複雜度(風險)是固定的
所以說夠僵持的時候"推測"可能就不會出這些看起來有問題的

By Brianna
at 2016-04-27T13:51

其實我覺得現在很大一個點就是,人類覺得的好壞,似乎
AG不這麼認為,而事後看起來也...

By Liam
at 2016-04-27T17:55

問題就是當電腦在布局下出怪手小李並沒有去反擊

By Aaliyah
at 2016-04-30T11:38

你第一行哪來的? 幾乎沒人這樣講

By Joe
at 2016-05-03T23:36

如果前兩盤是針對AlphaGO可能的弱點而下出有別以往
的策略/棋風那在0:2下後三盤我也認為該回到合理的
應手

By Selena
at 2016-05-07T06:19

所以根本也無法說那些是好棋反正人類還是不會學電腦的棋

By Madame
at 2016-05-08T23:31

好棋是慢慢累積的壞棋是後面無法挽回的

By Rebecca
at 2016-05-10T15:41

我不算懂圍棋只看了柯直播
柯一直說李下的很怪不像平常的李

By Tracy
at 2016-05-14T04:40

會扯到劫也是說打劫去拼九死一生

By Ula
at 2016-05-17T21:40

不打劫去拼十死無生只是局面不會整個崩這樣輸
然而李沒打劫所以柯一直覺得很奇怪

By Iris
at 2016-05-21T20:16

問個白癡問題,AlphaGo的型不好那麼顯而易見

By Ida
at 2016-05-22T13:43

那時李也沒時間了在讀秒

By Kyle
at 2016-05-25T15:09

昨天是有提到有部分是局部優劣可以直接"計算"比較
有提到這邊afgo有部分落子沒有達到最佳解

By Delia
at 2016-05-29T13:43

AG下的手法也超出預期呀,不是說用往常下法就一定好

By Ula
at 2016-06-01T12:14

那為什麼李會連出緩手讓優勢就這樣溜掉了？

By Tracy
at 2016-06-06T10:21

型不是重點問題是型爛你都贏不了啊

By Heather
at 2016-06-09T07:59

而全局的子後面柯也沒說afgo下錯頂多說值得討論

By Ivy
at 2016-06-12T18:34

ch 大人類不是機器犯錯不是很正常嗎XD 況解比賽壓力這

By Hedwig
at 2016-06-15T06:39

麼大
還要讀秒限時

By Hamiltion
at 2016-06-16T23:08

拓海一開始跟車也只是讓人覺得還算會開哪知道最後甩不掉

By James
at 2016-06-17T11:55

最重要還是自己被逼到超時壓力大被超過去

By Madame
at 2016-06-18T17:02

有人就說電腦算到終盤了阿 XD

By Charlotte
at 2016-06-23T11:55

感謝回答，所以現在職業棋手的見解是

By Hamiltion
at 2016-06-26T22:50

這盤兩邊都犯錯太多，不能算是名留歷史的一盤棋嗎？

By Michael
at 2016-06-29T05:13

來個二日制，柯可以無限call out各研究室

By Zenobia
at 2016-06-30T09:19

第一盤應該歷史意義比較大吧

By Selena
at 2016-07-04T02:06

下了一整盤好棋結果緊要關頭下出一手臭棋,結果還是會輸

By Bethany
at 2016-07-07T05:33

這樣才能下出接近人類最高水準的棋

By Dora
at 2016-07-11T13:45

兩日制你打卦，隔天就輸飛了

By Oliver
at 2016-07-13T14:08

一些話如"捍衛人類尊嚴"都說出來了恐怕應該考慮合
乎過去棋理的應手

By Emma
at 2016-07-15T03:16

分佈式擴大硬體規模，和打卦的時間，意義是一樣的

By Callum
at 2016-07-17T03:46

手機手殘按到噓抱歉推回

By Harry
at 2016-07-19T03:02

往四路壓不會讓 AG 的中央有更強的勢力嗎?

By Hedda
at 2016-07-23T10:50

昨天壓五最後右邊也還是白子的地吧

By Thomas
at 2016-07-24T11:49

我不太懂Monte Carlo搜尋，不過AlphaGo的機率應該不是

By Edwina
at 2016-07-26T14:47

直覺意義上的機率，比較像是因為無法窮盡變化而做的估計

By Frederic
at 2016-07-29T16:59

白64古力也是說白棋擠在一團沒效率是緩著

By Dinah
at 2016-07-30T08:50

我知道背後機率沒那麼簡單:D 只是說勝率最高不見得是最佳解

By Sandy
at 2016-08-02T06:35

而這個遊戲是有最佳解的(如果有圍棋之神窮舉法:D)

By Wallis
at 2016-08-07T05:36

這遊戲或許有最佳解但其實過去長久累積的觀念所追求的
說到底也是勝率最高的解而未必是最佳解

By Elvira
at 2016-08-11T12:50

我班門弄斧了XD 我是猜測他應該是很有效率的逼近邏輯

By Daph Bay
at 2016-08-12T07:50

反了，是我下這手勝率有多高，而非對手下這手勝率多高

By Sierra Rose
at 2016-08-13T06:29

只是人知道要局部考慮，AG不知道，所以在局部上AG有弱點

By Joe
at 2016-08-15T23:52

而且實際上蒙地卡羅不會只搜一層random算

By Audriana
at 2016-08-19T03:48

而是在允許的時間內多算幾層，所以唯一解他還是會看到

By Joe
at 2016-08-22T12:33

所以電腦會去搜尋下z之後的勝率，會發現這步勝率很高

By Hedwig
at 2016-08-23T15:46

因此電腦會避免讓對手下z。

By Blanche
at 2016-08-24T01:32

謝謝回答

By Dorothy
at 2016-08-24T09:25

我不認為它會對必勝必敗的點做排除。基本上就是對全局找一個
勝率高的解。攻殺不會出錯是因為他把後面變化都看過了

By Xanthe
at 2016-08-26T14:52

能算出來必敗的點可以排除吧,現在是算不完
所以例如本文中第二段那種案例,阿發狗不會下的

By Barb Cronin
at 2016-08-30T04:54

每個可能的選擇會有一個分數, 分數會由該分支往下算

By Zenobia
at 2016-09-03T22:24

所以如果接下來有很大的可能虧損, 分數上自然會被排除
有件事大概可以肯定, 就是"AG不會做出虧損太大的選擇"

By Isabella
at 2016-09-06T01:34

甚至可思考為,在可接受時間內,算出95%的後續變化都能贏

By Barb Cronin
at 2016-09-08T15:49

那算路超深的妙手應該是不一定算得出，小手筋還可以

By Daph Bay
at 2016-09-08T20:11

但必須給對方正解的那node特別高的權重電腦才知道不能下吧

By Hedda
at 2016-09-12T01:48

因為 AG 根本只是在計算它上不知道自己正在下圍棋

By Skylar DavisLinda
at 2016-09-15T14:24

剩下的絕對不夠時間算不完,那就這樣子下了

By Queena
at 2016-09-20T09:32

事實也證明棋評認為是臭手的並無法從中獲得太多利益

By Queena
at 2016-09-23T02:54

蒙地卡羅有點難講清楚，但是電腦在這塊不太會出錯

By Kristin
at 2016-09-24T05:08

第三段的假設是沒錯但是好像要在貓脖子上掛鈴鐺一樣

By Sarah
at 2016-09-25T17:07

想在早期靠"不是很好的著手"取得利益, 本身也很難做到

By Connor
at 2016-09-26T20:23

AlphaGo 當然不是無敵, 單機都還是可以擊敗分散式了

By Zenobia
at 2016-09-27T06:26

樓上，當然，alphaGo還沒有train到最好

By Yedda
at 2016-10-01T22:33

就算train到最好，也不一定能到圍棋之神的實力

By Connor
at 2016-10-05T15:32

問題是要壓過人類實力不需要到圍棋之神啊 @@

By Agnes
at 2016-10-07T07:40

是的。

By Ethan
at 2016-10-11T01:55

所以單機和分散對下是不錯的指標, 愈靠近 100%, 就知道
實力愈強了

By Hamiltion
at 2016-10-13T04:37

實際上alphaGO進步的地方並非單機跟離散
離散勝率高只是因為它算得比較快，可以多算一點

By Frederica
at 2016-10-18T02:46

alphaGO進步的話則是在算之前的候選挑選進步
要知道實力有沒有變強應該是用新版的跟舊版的比較

By Ingrid
at 2016-10-20T18:28

理論上算的愈深愈有機會找到更佳解新舊只差在訓練

By Genevieve
at 2016-10-21T14:36

分散式勝率提高代表運算加深以後正確率有提高

By Franklin
at 2016-10-26T11:00

alphaGO的重點就在訓練，搜尋多深都只是硬體的問題

By Tom
at 2016-10-30T06:03

我甚至認為，當train的越好，單機的勝率會提升

By Anthony
at 2016-11-04T03:52

單機或分散兩邊都 train 過一樣的東西啊 /_\

By Selena
at 2016-11-08T05:05

分散能找到更多確實更好的選擇才是代表訓練成功不是嗎?

By Jessica
at 2016-11-09T16:26

找到好的選擇這件是對單機跟分散是一樣的

By Liam
at 2016-11-12T00:48

差別在於分散從好的選擇裡面挑出最好的會更好
所以如果deep learning 已經好到幫你挑的非常好
那你其實不太需要運算量就能選出最好的那步

By Liam
at 2016-11-14T15:42

此時就不太需要分散運算

By Harry
at 2016-11-17T09:12

我覺得在前中段講這個沒啥可能耶後段則已經是公認的強

By Sarah
at 2016-11-21T01:09

同marrvosal 覺得單機勝率越高才表示成長克服了運算速度

By Isla
at 2016-11-23T09:44

你的解釋一日棋迷看的懂才有鬼有的話樓下幫我吹

By Franklin
at 2016-11-27T02:32

marrvosal的解釋完全正確。

By Gary
at 2016-12-01T18:47

我這種只上過AI intro的人都看得出來你講什麼胡話。
蒙地卡羅基於的本來就是最大最小樹。維基一下最大最
小樹就完全解答你這篇的外行問題了。

By Ursula
at 2016-12-03T15:25

哥沒上過AI intro，你可以在板上開課，請

By Zanna
at 2016-12-06T10:24

https://en.wikipedia.org/wiki/Computer_Go
這裡就有說會有我提的疑問了，加入minimax可以理解，但那是

By Doris
at 2016-12-10T01:00

game theory的東西跟monte carlo tree不是直接關係，謝謝

By William
at 2016-12-11T12:11

總之就是加一個選擇最好的最差解的判別來濾掉必敗局面

By Rebecca
at 2016-12-13T13:43

我還是覺得不是，Monte Carlo tree search理論上會收斂

By George
at 2016-12-16T18:33

到minimax，我猜測這裡也是類似的原理：自己和對方的好

By Lucy
at 2016-12-18T22:52

手在MC tree裏頭會走得特別深。如果對『好手』的判斷
夠準就可以避免你說的問題。

By Todd Johnson
at 2016-12-19T08:39

我也不知道我說的對不對，marrvosal要不要發一篇教學XD

李世石 VS AlphaGo 第二局看法 - 圍棋

All Comments

Related Posts

李世石 VS AlphaGo 第二局看法

驕傲

可否更改alphago的設定

可否更改alphago的設定

這兩盤棋沒人會比李世石做得好