電腦弱點:中腹有打劫可能的複雜生死戰? - 圍棋

Queena avatar
By Queena
at 2016-03-14T17:25

Table of Contents

※ 引述《Vonix (台灣大賭場歡迎您)》之銘言:
: 我嘗試用一句話來講ALphaGo的弱點
: 昨天AlphaGo第一次暴露出弱點,不知道是不是李世石有意為之?
: 李世石在左右方都避開了戰鬥,卻在大局不利時才在中央掀起戰鬥,
: 從盤後解析可以看出,白78神手挽回了局面,但若黑棋應對得宜,
: 局面其實還是細微;但卻造成電腦崩潰自爆。
: 從機器的角度來理解,中腹戰鬥比邊角更複雜難算,且昨天的例子有
: 可能形成大劫爭(但打下去黑棋整體也沒有不利),電腦在這種CASE
: 爆掉,不知道第五盤李世石會不會再度製造這種局面?

我覺得人一開始誤會了電腦的強處與弱處,也許是小李前幾盤一直無法突破的關
鍵。

多數人覺得電腦布局或大局觀應該很弱,因為變化太多,但這可能反而才是電腦
的強處。人類學布局的棋書通常是給幾個選項讓人去分辨哪個點更大,但這其實
很難估計的,很多解只是方向配合或"感覺上"較佳,是否如此難以驗證。但電腦
是用海量的模擬資料的勝率來決定落點,假設電腦是九段實力。他自我對弈了那
麼多盤,如此選出的著點更準確是頗有可能的。

所以這幾盤看得出電腦對厚勢的利用或是對弱棋的處理下得非常好。當然電腦應
該不知道厚勢是甚麼,但他用海量的模擬下去就會發現某些著點因為能和厚勢搭
配自然勝率高。而電腦也會適時補弱棋,因為模擬後應該會發現不補會讓勝率下
降。

而電腦真的不及人類的可能反而在於攻殺,而且是要較大範圍延伸且手順較複雜
的攻殺(範圍太小電腦的模擬應該可以把所有情況都跑完)。一開始多數人都假設
電腦對於攻殺的細算應該不可能出錯,因為可以暴力窮舉法,但正因為AG不是用
窮舉法,反而高段棋士對於區域的細算會更接近窮舉法,也就是更接近圍棋上帝
,所以可以占優。

人在算攻殺的時候靠經驗可以把可能落子侷限在非常少數的著點,並且細算其中
所有變化。而且變化中可能部分手順是固定的,對人來說又把問題變簡單很多。
但對電腦來說其他各種不相干的點他都要考慮,人類所謂的必然解對他來說也不
是必然(像小李昨天說只此一手,AG字典裡絕對沒有只此一手這種事),自然有機
會選錯點或誤判情勢。第二盤的左下處理或昨天中間被手筋一挖就當機都是這種
較大範圍的攻殺。

前幾盤看得出來電腦是能走厚就走厚,能補棋就補棋,沒甚麼機會讓小李搞出複
雜攻殺,到昨天才第一次出現。

電腦好似還有一個問題就是落後時下出的各種大虧損無理手。當然可以理解電腦
的邏輯就是:這樣下你不應我就贏了所以勝率很高,但這對人類是沒用的。相對
於之前有人假設電腦落後會變更強因為要追回來,目前看起來反而是電腦落後就
走遠了,因為它的追棋方式對人類來說是毫無意義的只會讓自己越虧越多勝機越
渺茫。

--
Tags: 圍棋

All Comments

Ethan avatar
By Ethan
at 2016-03-15T06:58
這論點很有道理
Queena avatar
By Queena
at 2016-03-15T19:33
還有一個可以利用的明顯弱點, 就是棋手跳出一般作戰區域
時, 可能造成 MCTS 前面計算的結果全部作廢 要重新計算
Oliver avatar
By Oliver
at 2016-03-19T01:07
alphaGo下一手的候選機率也不是集中在局部區域
Anthony avatar
By Anthony
at 2016-03-22T10:44
所以有先手的時候可以選擇適時換邊攻擊, 佔電腦的便宜
通常都是 至少排在後面的棋步 算的深度就不會一樣
Faithe avatar
By Faithe
at 2016-03-23T17:37
尤其是中盤之前 因為選擇性太多 平常不可能都算的很深
Olivia avatar
By Olivia
at 2016-03-26T10:03
毫無意義會自殺的棋要用機制擋住
Iris avatar
By Iris
at 2016-03-30T15:23
樓上還是沒搞懂啊... 這種違背開發原意的事情不可能做的
Eartha avatar
By Eartha
at 2016-03-31T17:40
最多再設計一些訓練方式想辦法教會它...
其它開發者也注意到它完全不理會局部死活和對殺分析
Hedwig avatar
By Hedwig
at 2016-04-02T04:52
這是安全機制 加進去有什麼問題嗎
Hamiltion avatar
By Hamiltion
at 2016-04-06T06:44
這樣就不是他自己學會了…
Delia avatar
By Delia
at 2016-04-08T19:13
因為不是要製作圍棋軟體, 而是想辦法教會這套系統下圍棋
Carolina Franco avatar
By Carolina Franco
at 2016-04-13T13:44
推這篇 某人的發言真的可以不用理會 夏蟲語冰
Bennie avatar
By Bennie
at 2016-04-16T02:15
不然征子就要跑嗎
Oscar avatar
By Oscar
at 2016-04-19T03:21
這軟體下圍棋只是順便
Eartha avatar
By Eartha
at 2016-04-22T08:36
過程中發現問題設法改良, 將來都可能直接用在其它領域
Christine avatar
By Christine
at 2016-04-25T18:29
如果只是下棋的話, 哪會有這麼多大公司相繼投錢進來研究
Todd Johnson avatar
By Todd Johnson
at 2016-04-26T08:40
其實安全機制也沒說錯,今天會發生勝率狂跌就相當於發
Erin avatar
By Erin
at 2016-04-26T10:41
除了最後的應手部分推論怪怪的,基本上蠻合理的。
James avatar
By James
at 2016-04-30T22:34
生超出原先AI預期的情況,就圍棋來看AI的處理還有很大
Franklin avatar
By Franklin
at 2016-05-04T18:30
AG有發現勝率狂跌啊, 只是已經來不及了
James avatar
By James
at 2016-05-06T14:19
的進步空間,就像電動車總不能突然有個突發事件,車子
突然加速去撞牆壁吧
Quintina avatar
By Quintina
at 2016-05-09T19:37
本來就要考慮安全機制好嗎 一個沒有安全機制的系統是能
商業化?
Anonymous avatar
By Anonymous
at 2016-05-09T21:56
要注意設安全機制也是會把好棋下爛
Vanessa avatar
By Vanessa
at 2016-05-13T08:23
問題是現在沒有要商業化啊, 現在單純只想看ML的效果而已
Ula avatar
By Ula
at 2016-05-16T03:46
這不是雖便說說就能做到
Olga avatar
By Olga
at 2016-05-20T15:43
AlphaGo從一開始就沒有要商業化,那只是研究人工智慧中
限之一的「圍棋」罷了。
Jacob avatar
By Jacob
at 2016-05-24T23:58
現在還研發階段 加上這種安全機制反而就看不出問題了
Valerie avatar
By Valerie
at 2016-05-29T07:51
既然要談 這個原來不用加安全機制 那谷哥的自動車你可以
去做了
Frederic avatar
By Frederic
at 2016-05-31T13:30
發現問題直接想辦法掩蓋掉不算是什麼好方法吧 /_\
直接找到問題的根源並且想辦法改進才是上策
Kelly avatar
By Kelly
at 2016-06-01T14:36
google的無人車是已經有在做了啊,只是還沒量產商業化
Aaliyah avatar
By Aaliyah
at 2016-06-05T20:59
你要設定好的安全機制 前題你實力要有李世石水準才行
Oliver avatar
By Oliver
at 2016-06-07T20:12
沒法理解棋理 要怎麼定義好的安全機制
Margaret avatar
By Margaret
at 2016-06-11T08:02
問題的根源通常比想像中的複雜太多也太困難了
Isla avatar
By Isla
at 2016-06-14T07:33
其實 AlphaGo 現在的架構比較接近工藝製品, 元件都是
別人做過的現成理論, 但是湊起來整合的部份沒有人做過
這中間有太多可以調整的東西, 給他們一點時間解決吧
Rachel avatar
By Rachel
at 2016-06-16T00:17
這種非統計程式設計 通常比需要對該領域非常熟悉才行
Odelette avatar
By Odelette
at 2016-06-19T09:25
裡面有太多細節,包括MC法中常為了效率而會沿用前幾步
Jake avatar
By Jake
at 2016-06-20T05:57
已經算過的東西, 盤面沒有改變能用的一定是直接繼續用啊
Sierra Rose avatar
By Sierra Rose
at 2016-06-21T14:34
所以我才會說 可能狀況下設法儘量跳出原有的樹有便宜佔
整合這些不同領域的技術沒那麼容易, 所以才會被認為至少
技術上領先一年以上... 很多過程都得靠嘗試錯誤
Skylar Davis avatar
By Skylar Davis
at 2016-06-22T22:15
的支狀來幫忙運算,就下圍棋獲勝這個議題,目前看來就
還有改進的空間,而安全機制是一個較快能解決的方向
Lauren avatar
By Lauren
at 2016-06-23T04:27
只是單純工藝是上不了nature的 他還是有創新的地方
至少他湊的起來而且證實有效 一般亂湊下場就是垃圾
Doris avatar
By Doris
at 2016-06-24T08:18
競爭者以它的論文作為起點出發, 也不是沒有可能趕上
Bennie avatar
By Bennie
at 2016-06-26T03:28
損棋自殺棋不下 加進去檢查這沒有很困難
Lucy avatar
By Lucy
at 2016-06-27T14:59
什麼叫損棋自殺棋? 不做死活分析意思已經夠明白了吧
Mary avatar
By Mary
at 2016-06-28T12:54
人家都有安全機制 送菜棋也是不下的
Hedda avatar
By Hedda
at 2016-06-29T08:28
隨便舉一個方法,也許要多弄幾組黑貼目不同的決策函數
Cara avatar
By Cara
at 2016-07-04T08:10
當勝率低於40%時用不同的黑貼目策略來下,就可以改善一
Ina avatar
By Ina
at 2016-07-08T21:55
就算真要做 他們應該也會選擇想辦法教會電腦什麼是死活
Leila avatar
By Leila
at 2016-07-10T12:26
次想直接逆轉的模式,而能靠著一步步慢慢追目來獲勝
Dora avatar
By Dora
at 2016-07-12T02:32
可能的改變是調整不同時期的權重, 現在是固定 0.5/0.5
Olive avatar
By Olive
at 2016-07-14T03:25
簡單的程式判斷都是用 && == <= >=
Zanna avatar
By Zanna
at 2016-07-17T22:15
只能說, 電腦下棋的數量還遠遠不夠啊 (?
Michael avatar
By Michael
at 2016-07-19T10:53
那應該把布局書丟了學alpha流布局等到中盤在用人類算法XD
Rebecca avatar
By Rebecca
at 2016-07-21T20:38
FB 的田博士認為這不一定好(他選擇完全不用估值網路)
Ida avatar
By Ida
at 2016-07-23T09:26
目前的AI還不是完全靠自我學習出來的,很多策略都還是
Valerie avatar
By Valerie
at 2016-07-24T13:28
你有用過嗎 參數怎麼設定 演算法怎麼設計 不是隨便說說的
google應該能想的到 只是沒這麼簡單
Hedda avatar
By Hedda
at 2016-07-28T03:53
現在AG這個死活不懂純靠棋感跟機率就能把職9殺成這樣真的猛
Damian avatar
By Damian
at 2016-07-29T04:11
型是判斷本來就會加入死活判斷
Todd Johnson avatar
By Todd Johnson
at 2016-07-31T17:25
? 走子網路/rollout/估值網路 都是 100% 學習得來
Vanessa avatar
By Vanessa
at 2016-08-01T16:37
沿用棋譜,要完全從知道規則用亂數開始學可能要花很多
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2016-08-02T02:32
人類做的事情是儘量幫助它有效率的學習
Iris avatar
By Iris
at 2016-08-04T06:43
年,google執行長也說了這是他們未來的目標
Todd Johnson avatar
By Todd Johnson
at 2016-08-08T01:41
不作死活分析就無法知道局勢好嗎
Odelette avatar
By Odelette
at 2016-08-10T04:54
基本策略函數還是從人類棋譜當初始條件
Megan avatar
By Megan
at 2016-08-13T22:34
田博士也覺得很厲害 因為這個估值網路有表現出死活判斷
的能力 只是看來還有些缺陷
Todd Johnson avatar
By Todd Johnson
at 2016-08-18T02:14
要讓電腦從亂數下點了解到星位最佳絕對不是三千萬盤能
Genevieve avatar
By Genevieve
at 2016-08-20T18:02
知道的,那可能是數億數百億盤的天文數字
Hedwig avatar
By Hedwig
at 2016-08-24T21:58
這裡的"三千萬盤"其實是指訓練估值網路的過程, 但是
估值網路不見得是必需品(這部份被認為是最近才加進去的
Suhail Hany avatar
By Suhail Hany
at 2016-08-27T18:39
同意 大型攻殺電腦要算清真的也不是很容易的 人類未必會
輸...
Linda avatar
By Linda
at 2016-08-30T05:46
下錯一步就全死 即使下的順序不一樣
Leila avatar
By Leila
at 2016-09-03T23:34
所以可靠度可能不如之前就完成的其它元件)
Faithe avatar
By Faithe
at 2016-09-07T03:40
這電腦下法這麼跳躍 會全下對嗎
Ida avatar
By Ida
at 2016-09-11T12:38
也許我記錯了,不過之前訪談有提到下次目標是從零開始
Steve avatar
By Steve
at 2016-09-14T00:56
不是要全下對 這部份要保留隨機性才好 否則反而會變弱
它是希望訓練過程出現各種各樣不同的狀況 所以前期用
Harry avatar
By Harry
at 2016-09-16T01:00
跟星海ai玩 只要夠偷 玩死對方不是難事
Robert avatar
By Robert
at 2016-09-18T01:23
不知能不能應用在圍棋上
Andrew avatar
By Andrew
at 2016-09-21T07:39
只要偷到一個重要的棋 局勢就會崩盤
Mia avatar
By Mia
at 2016-09-23T11:48
SL網路確保走子有多樣性, 後面再改用RL走到完提高精確度
Gilbert avatar
By Gilbert
at 2016-09-26T15:24
只是第三盤的劫殺 李40看樣子是輸了
Valerie avatar
By Valerie
at 2016-09-30T04:53
不過也是因為時間不夠
Damian avatar
By Damian
at 2016-10-03T20:22
這種作法是不是夠好目前沒人知道 所以才需要測試工程師
Oliver avatar
By Oliver
at 2016-10-08T19:09
有點機率用偷的方式
Thomas avatar
By Thomas
at 2016-10-12T19:01
覺得可以加入危機意識網路,當有危機時啟動深入分析
Freda avatar
By Freda
at 2016-10-17T18:24
圍棋真的是一個很好的測試AI水平之競技
Linda avatar
By Linda
at 2016-10-18T12:03
實戰測試的前提是要拐到一流的棋手陪你玩啊 lol
Xanthe avatar
By Xanthe
at 2016-10-19T16:25
如果看到職業看到97 101應該是不會來下的
Sierra Rose avatar
By Sierra Rose
at 2016-10-21T02:43
職業棋士如果看了覺得很弱很簡單, 真的上去會死的很難看
Jacob avatar
By Jacob
at 2016-10-25T07:06
不過第四盤可以確定 谷哥測到他想要的一些額外的事
Suhail Hany avatar
By Suhail Hany
at 2016-10-28T01:26
對照當時局面那一連串參數變化, 對未來改進方向很有價值
Olivia avatar
By Olivia
at 2016-10-30T22:33
不過蠻好奇AJA沒有測過讓AG在極劣下下過棋嗎?還是說不是每
Elvira avatar
By Elvira
at 2016-11-02T05:11
一種劣勢AG都會發瘋? 或是97手時李世石贏的其實比想像還多
Todd Johnson avatar
By Todd Johnson
at 2016-11-05T11:18
這樣想用雪崩類複雜定石也可能可以婊到電腦
Gary avatar
By Gary
at 2016-11-07T11:38
可是如果是定石 AG的走子網路來自職棋不容易錯吧?
Oscar avatar
By Oscar
at 2016-11-08T21:34
職棋棋譜數量應該不足把複雜定石變化都走完,加上AG又有自
己神奇的判斷,定石走錯一手崩盤應該有機會:D
Joe avatar
By Joe
at 2016-11-11T10:59
DeepMind老闆說他們沒用職業棋譜 只用業餘棋譜 lol
Rosalind avatar
By Rosalind
at 2016-11-13T08:30
SL 網路的目的不是要多準 有個大概也就行了
Frederic avatar
By Frederic
at 2016-11-17T19:53
這很合理啊 因為開發者有人只到業餘高段
Hamiltion avatar
By Hamiltion
at 2016-11-21T04:56
演算法要設計的好 也要設計者很懂圍棋
Selena avatar
By Selena
at 2016-11-22T00:25
那種無理手都是線上下棋會遇到的賴皮棋,真沒看到是
會逆轉
Olive avatar
By Olive
at 2016-11-24T02:00
雪崩應該沒機會,看13盤就知道了,大攻殺會變單行道
Tom avatar
By Tom
at 2016-11-25T10:52
24盤穩穩走的比較有機會,因為次一手分布很廣
Steve avatar
By Steve
at 2016-11-26T11:26
我們覺得"單行道"電腦不見得覺得是,加上周遭點夠多混淆它
Michael avatar
By Michael
at 2016-12-01T10:39
或許會有下錯,也是猜測而已 因為定石幾乎都人類窮舉法最
Elma avatar
By Elma
at 2016-12-05T18:01
佳解,電腦既然不懂這個要靠模擬是有機會推不出來的
Rebecca avatar
By Rebecca
at 2016-12-10T14:06
所以我覺得雪崩妖刀或開頭大攻殺沒機會,把譜上輸的著
手濾掉就好,反而是大模樣爆破比較不好運算
Anonymous avatar
By Anonymous
at 2016-12-11T10:05
被爆的位置太隨機了
Wallis avatar
By Wallis
at 2016-12-12T16:47
Annie avatar
By Annie
at 2016-12-14T16:12
蠻合理
Ursula avatar
By Ursula
at 2016-12-15T12:45
認同
David avatar
By David
at 2016-12-18T10:26
雪崩alphago好像會主動避開
Megan avatar
By Megan
at 2016-12-20T09:39
樊麾表示
Caitlin avatar
By Caitlin
at 2016-12-24T20:48
AG要「學」會安全機制,而不是「教」他安全機制

圍棋AI AlphaGo 之我見

Rosalind avatar
By Rosalind
at 2016-03-14T16:18
1. 據說 AlphaGo用到的Neuro Network深達13層 有任何穩定性的報告或是說明嗎? 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 AlphaGo的設計應該是循著第一條路線 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 反敗為 ...

古力評柯潔是網紅 柯潔慶祝李世石首勝喝

Ethan avatar
By Ethan
at 2016-03-14T16:03
古力評柯潔是網紅 柯潔慶祝李世石首勝喝醉(圖) 北京時間3月14日,因為李世石和谷歌AlphaGo的人機大戰,圍棋運動再度受到公眾的關注 ,擔任解說嘉賓的柯潔、古力等人也都成為了“網紅”。在李世石贏棋之後,古力和柯潔 兩位世界冠軍都有“大動作”,古力註冊了微博,自稱為了關注柯潔,柯潔則直接喝醉了 。    ...

從象棋觀點看AlphaGO為什麼會輸

Iris avatar
By Iris
at 2016-03-14T15:55
原文恕刪... 本文只是要借用一下變化圖來講AlphaGO第四局為什麼會輸所以連標題都換了敬請見諒 相信大家都覺得很好奇... 為什麼AlphaGO前幾盤走的像神 昨天卻整個像是吃了瀉藥一樣整個烙賽? 坦白講...當昨天看到白78以後一段 我不但不意外 反而還覺得很熟悉、很感動...像是喚醒了塵封已久的 ...

Facebook工程師解疑:AlphaGo為什這厲害

Daph Bay avatar
By Daph Bay
at 2016-03-14T15:40
Facebook工程師解疑:AlphaGo為什麼這麼厲害?  Facebook田淵棟解析演算法技術:AlphaGo為什麼這麼厲害?   最近我仔細看了下AlphaGo在《自然》雜誌上發表的文章,寫一些分析給大家分享。   AlphaGo這個系統主要由幾個部分組成:   走棋網路(Policy Netw ...

「戰勝自己」對於AlphaGo而言不只是口號

Odelette avatar
By Odelette
at 2016-03-14T15:12
※ 引述《Tkuei (itand#39;s me)》之銘言: : 這是台大資工林守德老師在他FB寫的一篇文章,是他看過Nature那篇論文之後寫的感想 : 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解 : 原文連結:https://goo.gl/m8cBHn (FB連結,不喜誤入) 小 ...