alphago繼續發展下去 - 圍棋

Genevieve · 2017-11-05

Table of Contents

Post
Comments
Related Posts

※ 引述《forgetta ( )》之銘言：
: 想請教問關於水平線效應的問題
: 之前會聽說哪個版本的AG可以讓哪個版本幾顆這些對戰是怎麼來的?
: 因為王銘琬老師的書中有寫到水平線效應
: 如果AI勝率太低的時候會開始亂下追求翻盤的機會例如對李世石的比賽就有出現
: 但如果是讓兩子開始下為什麼不會一開局就出現水平線效應而還可以授子獲勝?
: (例如讓兩子會不會一開始計算出的勝率就只有1%?)

我解釋一下好了，其實我們看起來所謂的亂下追求翻盤，在AI自己看來其實它還
是很認真下，而且並沒有因為勝率低而改變思考方式，亂下是人類的解讀。

為什麼會出現人類覺得亂下的情況？

舉個例子，現在我持黑，盤面已經慘輸四十目而且快小收官了。現在我考慮兩手
棋：

A ：穩穩收個官子，賺到個一目
B ：亂下個奇怪的地方，對方就算不應我也沒賺還可能倒虧十目

如果是人類，不用多想也會選A。可是AI眼裡不是長這樣的：

A ：勝率1%
B ：勝率0.8%

AI完全不會考慮目數的差別，輸半目跟輸五十目都是輸，沒有高下之分。所以當
不同著手勝率接近時，事實上會帶有一定隨機性地選擇要下哪一手。所以假設只有這
兩手，則AI選A或B的機率很可能接近50-50。

它並沒有因為勝率很低了所以「特別去下怪手」，而是因為到很確定落後的情況
下，最佳的下法跟白癡下法勝率其實都差不了多少了。而我們知道，好的下法可能就
那一兩手，但爛下法可是遍布全盤啊。那麼在所有下法機率差不多的情況下，選到爛
手的可能性當然就明顯高很多了。

那麼為什麼不會前期讓兩子就開始亂下呢？主要可能有幾個原因：

1. 序盤其實不確定性還很高，在沒算清的情況下，勝率其實不會直接低到最佳著手
跟亂下差不多的情況。比如說好好下還是有個33%勝率，但亂下一手直接掉到26%，差
別大的情況就還是會從最佳著手之中來選取，而不會選到明顯亂下的部分。即便AI計
算能力很強，目前不至於有能力讓二子就算清到覺得勝率剩1%的程度。

2. 另外就是自從李世石的一勝後，這個問題應該也有被特別考慮，是有一些手段可
以減輕這種亂下情況的。

3. 再來就是計算力提升得更高的情況下，AI更有機會找到勝率更高的好手，也更能
算清下得不好會有多慘，因此好手跟劣手的勝率估計應該會更有機會拉開，同第一點
的理由，AI就更有機會去選到好手，即便在大幅落後的情況。

--
「如果你沒法給我個解釋的話，死一萬次也不能彌補你的過錯！」

「我沒辦法死一萬次賠妳啊。」

「可是你有辦法半死兩萬次，知道嗎，嗯？」
－－蓮．席斯塔

--

圍棋