電腦弱點:中腹有打劫可能的複雜生死戰? - 圍棋

Anonymous avatar
By Anonymous
at 2016-03-14T17:56

Table of Contents

: 電腦好似還有一個問題就是落後時下出的各種大虧損無理手。當然可以理解電腦
: 的邏輯就是:這樣下你不應我就贏了所以勝率很高,但這對人類是沒用的。相對
: 於之前有人假設電腦落後會變更強因為要追回來,目前看起來反而是電腦落後就
: 走遠了,因為它的追棋方式對人類來說是毫無意義的只會讓自己越虧越多勝機越
: 渺茫。
其實如果我們假想自己是電腦,應該很容易可以理解這樣的行為。
在人的世界,當我們發現自己落後時,所用的方法可能是把局面弄的更複雜,
和對手比計算力;可能是採取守勢,等對手犯錯等等之類的。這些的前題是,
我們知道對手也是人,人在複雜的局面容易犯錯,人在慢長的棋局中很難每一
手都下的完美,可能這裡虧一點,那裡虧一點,最後就被追上了。

電腦呢?「他以為人的思考方式和他一樣」,所以,當他發現自己落後時,代
表在他所想的到的變化中,只要對手正確的回應,他都追不回來。
那他覺得對手會犯錯嗎?
1. 我想到了,為什麼他想不到
2. 如果他真的會下錯,那在每一種情況下都應該都有可能犯錯
=> 如果他每一種都有可能犯錯,那我當然下他犯錯後我得利最大的
所以我們在第四局會看到這些不可思議的棋。

換句話說,電腦並不知道「這一手很難,他可能想不到」這種事情,對於追回目
數的兩種選擇:
a) 這一手如果對手應錯了我得利 1 目
b) 這一手如果對手應錯了我得利 10 目
對人類來說,a 的難度可能遠大於 b ,所以我們下 a ,而不去下 b 。
但是這兩個選擇對電腦來說卻是 b > a ,
因為他覺得對手在 a b 兩個情況下犯錯的機率可能是差不多的。

以上是我對第四盤 87 手開始的解釋
(當然他在87手之後還是有比較正常的應手,所以這也不能完美的解釋他的行為)



--
Tags: 圍棋

All Comments

Lauren avatar
By Lauren
at 2016-03-18T22:45
推這篇,實際上八九不離十。
Anthony avatar
By Anthony
at 2016-03-20T09:13
對阿,所以才說這種機制對人類來說反而更容易維持優勢
George avatar
By George
at 2016-03-23T15:07
對腦不是選得利最大的吧 是選勝率最大的
Faithe avatar
By Faithe
at 2016-03-26T02:03
如果這樣的話 那一開始就出現一堆這種棋了 但是可惜都沒
Elizabeth avatar
By Elizabeth
at 2016-03-28T22:04
你這假設是a和b犯錯率差不多 但是如果犯錯率不一樣呢?
更何況今天這盤電腦開始起笑的時候他還沒輸 就自己算不
Franklin avatar
By Franklin
at 2016-03-31T09:21
清楚就開始發瘋了
Brianna avatar
By Brianna
at 2016-04-03T10:38
那邊人算覺得不明,也許電腦已經估自己勝率掉到很低了
Joe avatar
By Joe
at 2016-04-05T20:27
就是要把她打成豬頭連他媽(Aja大神)都不認得她才能逼瘋AG
Catherine avatar
By Catherine
at 2016-04-06T08:48
推,觀念很接近這樣,因為電腦是自己和自己對練來做learning
Christine avatar
By Christine
at 2016-04-09T18:11
邏輯上很合理
Carolina Franco avatar
By Carolina Franco
at 2016-04-11T04:39
我也是這樣想,所以AlphaGo落後時反而可能下的跟豬一樣
Kyle avatar
By Kyle
at 2016-04-13T16:45
這程式根本從頭到尾都不知道什麼叫目數
Brianna avatar
By Brianna
at 2016-04-15T06:35
他的確不知道,可是他覺得「會贏」,其實就是目數要比較多
Vanessa avatar
By Vanessa
at 2016-04-18T01:31
所以如果一個變化的目數追不回來,value network 的分數
大概也不會太高
Tracy avatar
By Tracy
at 2016-04-20T11:04
所以其實alphago如果建立賽局理論的模型是否可修正bug?
Wallis avatar
By Wallis
at 2016-04-24T21:24
要到確定輸才會下怪,前幾盤落後棋盤大很會追
Lydia avatar
By Lydia
at 2016-04-25T22:38
如果是這樣那對練時不就知道了...
Noah avatar
By Noah
at 2016-04-27T04:04
你的意思是alphaGo有“對手若應錯”的概念嗎?在論文哪裡?

初學者選購圍棋

Bethany avatar
By Bethany
at 2016-03-14T17:15
各位前輩, 最近想跟家人好好的學一下圍棋, 所以想買一組, 但有些疑問想請教 幾年前, 有朋友教我怎樣玩, 當是的棋盤是一片塑膠, 棋子也是塑膠的, 很爛, 很不好用 大概教了我一些基本的規則, 但其實我完全不會, 棋力是0, 連跟他玩玩的能力都沒有 最近跟家人提這件事, 也願意一起學習, 所以想說買正常 ...

阿爾法會修正第四盤錯誤明天不再犯嗎?

Elma avatar
By Elma
at 2016-03-14T16:31
其實有個很大的問號,雖然阿爾法對外的更新已經中止 但他自己有學習功能 上一場輸給李世石那盤,為了避免劫爭而導致崩盤的情形 不知在第五盤時是否會自動修正這個失誤? 面對類似選擇時,會下別的位置,或勇於打劫呢? 因為有前盤and#34;經驗and#34;,使他不再重蹈覆轍? 不知電腦自動學習功能是如何 ...

圍棋AI AlphaGo 之我見

Rosalind avatar
By Rosalind
at 2016-03-14T16:18
1. 據說 AlphaGo用到的Neuro Network深達13層 有任何穩定性的報告或是說明嗎? 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 AlphaGo的設計應該是循著第一條路線 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 反敗為 ...

古力評柯潔是網紅 柯潔慶祝李世石首勝喝

Ethan avatar
By Ethan
at 2016-03-14T16:03
古力評柯潔是網紅 柯潔慶祝李世石首勝喝醉(圖) 北京時間3月14日,因為李世石和谷歌AlphaGo的人機大戰,圍棋運動再度受到公眾的關注 ,擔任解說嘉賓的柯潔、古力等人也都成為了“網紅”。在李世石贏棋之後,古力和柯潔 兩位世界冠軍都有“大動作”,古力註冊了微博,自稱為了關注柯潔,柯潔則直接喝醉了 。    ...

從象棋觀點看AlphaGO為什麼會輸

Iris avatar
By Iris
at 2016-03-14T15:55
原文恕刪... 本文只是要借用一下變化圖來講AlphaGO第四局為什麼會輸所以連標題都換了敬請見諒 相信大家都覺得很好奇... 為什麼AlphaGO前幾盤走的像神 昨天卻整個像是吃了瀉藥一樣整個烙賽? 坦白講...當昨天看到白78以後一段 我不但不意外 反而還覺得很熟悉、很感動...像是喚醒了塵封已久的 ...