alphago繼續發展下去 - 圍棋

Table of Contents

※ 引述《forgetta ( )》之銘言:
: 想請教問關於水平線效應的問題
: 之前會聽說哪個版本的AG可以讓哪個版本幾顆 這些對戰是怎麼來的?
: 因為王銘琬老師的書中有寫到水平線效應
: 如果AI勝率太低的時候會開始亂下追求翻盤的機會 例如對李世石的比賽就有出現
: 但如果是讓兩子開始下 為什麼不會一開局就出現水平線效應 而還可以授子獲勝?
: (例如讓兩子 會不會一開始計算出的勝率就只有1%?)

我解釋一下好了,其實我們看起來所謂的亂下追求翻盤,在AI自己看來其實它還
是很認真下,而且並沒有因為勝率低而改變思考方式,亂下是人類的解讀。

為什麼會出現人類覺得亂下的情況?

舉個例子,現在我持黑,盤面已經慘輸四十目而且快小收官了。現在我考慮兩手
棋:

A :穩穩收個官子,賺到個一目
B :亂下個奇怪的地方,對方就算不應我也沒賺還可能倒虧十目

如果是人類,不用多想也會選A。可是AI眼裡不是長這樣的:

A :勝率1%
B :勝率0.8%

AI完全不會考慮目數的差別,輸半目跟輸五十目都是輸,沒有高下之分。所以當
不同著手勝率接近時,事實上會帶有一定隨機性地選擇要下哪一手。所以假設只有這
兩手,則AI選A或B的機率很可能接近50-50。

它並沒有因為勝率很低了所以「特別去下怪手」,而是因為到很確定落後的情況
下,最佳的下法跟白癡下法勝率其實都差不了多少了。而我們知道,好的下法可能就
那一兩手,但爛下法可是遍布全盤啊。那麼在所有下法機率差不多的情況下,選到爛
手的可能性當然就明顯高很多了。

那麼為什麼不會前期讓兩子就開始亂下呢?主要可能有幾個原因:

1. 序盤其實不確定性還很高,在沒算清的情況下,勝率其實不會直接低到最佳著手
跟亂下差不多的情況。比如說好好下還是有個33%勝率,但亂下一手直接掉到26%,差
別大的情況就還是會從最佳著手之中來選取,而不會選到明顯亂下的部分。即便AI計
算能力很強,目前不至於有能力讓二子就算清到覺得勝率剩1%的程度。

2. 另外就是自從李世石的一勝後,這個問題應該也有被特別考慮,是有一些手段可
以減輕這種亂下情況的。

3. 再來就是計算力提升得更高的情況下,AI更有機會找到勝率更高的好手,也更能
算清下得不好會有多慘,因此好手跟劣手的勝率估計應該會更有機會拉開,同第一點
的理由,AI就更有機會去選到好手,即便在大幅落後的情況。

--
「如果你沒法給我個解釋的話,死一萬次也不能彌補你的過錯!」

「我沒辦法死一萬次賠妳啊。」

「可是你有辦法半死兩萬次,知道嗎,嗯?」
--蓮.席斯塔

--

All Comments

Adele avatarAdele2017-11-08
感謝
Yedda avatarYedda2017-11-10
後盤亂下人類可以用計算確定是不是亂下 序盤畢竟還是靠感覺
人類後盤:你下這我怎麼可能不理
圍棋上帝看人機對戰整盤棋:電腦又下這種爛招騙小孩 這種
怎麼可能不理 過一會靠人類還真的不理歐
Yuri avatarYuri2017-11-11
其實照這邏輯,假如AG真的訓練到趨近圍棋之神,搞不好
Kama avatarKama2017-11-12
反而有一方會從頭到尾亂下XD 因為知道勝率都趨近於0
Ivy avatarIvy2017-11-16
不太可能吧,alphago zero從零開始訓練也從序盤亂丟到
趨近佈局下在那些點,前幾手在角跟在中央的勝率應該有
顯著的差異
Zora avatarZora2017-11-19
Olive avatarOlive2017-11-20
Eartha avatarEartha2017-11-21
所以說神阿,有個假象故事就是兩個神對弈,然後第二
手就認輸www
Zora avatarZora2017-11-22
*假設
Vanessa avatarVanessa2017-11-22
那個假像故事是兩方對坐,黑第一手想很久後認輸,白點了點頭
Zora avatarZora2017-11-26
不然黑第一手下在一之1,結果白認輸,不是很瞎嗎.XD
Madame avatarMadame2017-11-28
所以是意念之戰嗎?
Carol avatarCarol2017-11-28
這不就賭霸一式嗎...