AlphaGo發現自己79步失誤 - 圍棋

Olive avatar
By Olive
at 2016-03-13T18:13

Table of Contents

※ 引述《darkseer ()》之銘言:
: Demis Hassabis推特:(Deepmind 創辦人&CEO, 以下翻譯差勿怪)
: https://twitter.com/demishassabis
: 兩小時前: 李世石下得很好!AlphaGo本來認為自己下得很好,但在87手迷惑了。
: 我們現在有麻煩了...
: 一小時前: 錯誤發生在第79手,但AlphaGo到87手才意識到這點。
: (按: 自然地想跟78手有些關係,不過這裡沒有說明)
: 43分鐘前: 我的『認為』和『意識』,我指的是AlphaGo的價值網路value net,
: 在79手時認為勝率是70%,但到87手就沉下去了。
: (按: 原文只說value net,不清楚是簡稱還是具體單指value network)
: 34分鐘前: 李世石贏了!! 恭喜,他對我們很好的壓迫AlphaGo讓它犯出大錯。
他的意思可能是 AlphaGo 對於 79~86 手之間的盤面
value network 還是評估自己勝算很高, 但在 87 手突然掉下去.

value network (形勢判斷) 訓練出來的值有問題.
應該要更早幾手吐出勝算低的值, 才能避免往這種變化下.

79 是不是敗著不知道, 因為可能 78 一下黑棋就討不了好,
那麼敗著還要再往前推幾手.

--
Tags: 圍棋

All Comments

Dora avatar
By Dora
at 2016-03-16T13:36
是的,如果78是小李的逆轉手,那問題肯定出現在更早之前
Jake avatar
By Jake
at 2016-03-18T16:23
敗著應該是83,右邊不要動直接處理中間應該勝負還未知
Andy avatar
By Andy
at 2016-03-20T11:59
是不是小李大馬步飛出來 跑去右邊肩衝那一棋?
Puput avatar
By Puput
at 2016-03-25T03:42
再往前推的話可能就69直接下71位就不會有這些後續了
Doris avatar
By Doris
at 2016-03-25T10:37
這狀況代表的通常是這招從來沒看過 評估的時候當然漏了
Ina avatar
By Ina
at 2016-03-26T06:09
電腦優勢時會縮小棋盤減少變化.所以形勢判斷很重要
Daph Bay avatar
By Daph Bay
at 2016-03-31T00:21
這篇的理解應該是正確的。形勢判斷部分的策略邏輯應該有
問題。
Kumar avatar
By Kumar
at 2016-04-02T09:30
我覺得跟被吃子有關 因為子一被吃
盤面就改變了
Elvira avatar
By Elvira
at 2016-04-05T23:17
跟被吃子應該無關,因為AG會重新估算盤面。
Elma avatar
By Elma
at 2016-04-06T01:32
看起來勝率陡降是個很好的抓 debug 方式
Necoo avatar
By Necoo
at 2016-04-08T12:13
推,不過我對於value network是不是該稱為形勢判斷
Annie avatar
By Annie
at 2016-04-10T08:44
有些疑義XD 畢竟形式判斷是個圍棋詞語?
Olive avatar
By Olive
at 2016-04-14T04:00
會驚呼的原因是 79手後黑選擇打劫仍然是占優的局面
Daph Bay avatar
By Daph Bay
at 2016-04-18T06:45
但是黑選擇放棄打劫 卻又下出一連串自損的下法
直接導致局面翻轉

如果第五戰李世石..

Hazel avatar
By Hazel
at 2016-03-13T17:53
今天第四戰李世石下出了神之一手挖取得了勝利 假設 AlphaGo 可能的弱點就在於沒有繼續 reinforcement training 的狀態下 對於一樣的棋局可能會有一樣的反應 是不是第五戰只要下得跟今天一模一樣就會贏了? 因為就算把今天的棋局也讓它學習進去,也不過就是幾千萬盤中的一盤而已 如果 ...

柯潔:李世石贏回尊嚴 電腦挑戰我不夠格

Jacky avatar
By Jacky
at 2016-03-13T17:44
※ 引述《zkow (逍遙山水憶秋年)》之銘言: : 柯潔:解氣!李世石贏回尊嚴 電腦挑戰我不夠格 :  北京時間3月13日,棋手李世石與谷歌AlphaGo的人機大戰第四場今日開戰,最終李世石 : 開場佔據優勢,導致谷歌AlphaGo在比賽還剩54 秒的時候投子認輸,李世石扳回一城,大 : 比分變為1-3。擔 ...

我們直接問了AlphaGo:敢不敢和中國棋手

George avatar
By George
at 2016-03-13T17:42
我們直接問了AlphaGo:敢不敢和中國棋手比一場   新浪科技訊 日期:3月13日中午消息,昨天谷歌人工智慧AlphaGo與韓國棋手李世石今 日進行了第三場較量,最終AlphaGo戰勝李世石,連續取得三場勝利。接下來兩場將淪為 李世石的「榮譽之戰」。   昨日賽后發佈會上,不太了解谷歌的媒體採訪創始人謝 ...

AlphaGo 的可能性弱點

Quanna avatar
By Quanna
at 2016-03-13T17:35
在 柯潔 解盤的場子上,有一位教授說過一句話 對於電腦解盤是「概率」的概念,也就是從此子下去之後的各種走法, 最後會贏的盤有多少,之後走勢贏得盤數多的就會被電腦選擇為「概率」高的走法。 但此時對於人來說,有可能在邏輯上的走法就只有這麼一種 而這一種因為是基於邏輯,所以可以一路走到最後,完全避開所謂電腦 ...

李世石三連敗於AI 港棋手:他未發揮水準

Ophelia avatar
By Ophelia
at 2016-03-13T17:28
李世石三連敗於AI 港棋手:他未發揮水準 【on.cc東網專訊】 Google旗下公司研發的人工智慧程式AlphaGo,今日與南韓棋王李世 石進行第4回對決。香港冠軍、六段棋士李卓良今日接受東網訪問,直指雖然心裡 很希望 李世石今場能夠勝出今場賽事,但開局之初的形勢來看,暫時李世石處於下風。 李卓良觀看了 ...