電腦弱點:中腹有打劫可能的複雜生死戰? - 圍棋

Table of Contents

我嘗試用一句話來講ALphaGo的弱點

昨天AlphaGo第一次暴露出弱點,不知道是不是李世石有意為之?
李世石在左右方都避開了戰鬥,卻在大局不利時才在中央掀起戰鬥,
從盤後解析可以看出,白78神手挽回了局面,但若黑棋應對得宜,
局面其實還是細微;但卻造成電腦崩潰自爆。

從機器的角度來理解,中腹戰鬥比邊角更複雜難算,且昨天的例子有
可能形成大劫爭(但打下去黑棋整體也沒有不利),電腦在這種CASE
爆掉,不知道第五盤李世石會不會再度製造這種局面?

--

All Comments

Isla avatarIsla2016-03-16
以小李這等級的棋手,要再度製造這局面並不是不可能
Suhail Hany avatarSuhail Hany2016-03-17
推,另外請問是以演算法觀點來做出這個推論嗎?
Andrew avatarAndrew2016-03-21
你說的沒錯 可是小李居然說弱點是阿發夠執黑有可能會爆
之類的 這最好是有關係XD 他該不會故意不講出來弱點吧
Daniel avatarDaniel2016-03-24
他下完二十分鐘就記者會了,要這樣黑李九段太過了吧@@
Belly avatarBelly2016-03-29
從演算法角度來看...可能劫爭複雜度更高 他算不清楚勝率
如果只是直接打劫可能勝率還算的清楚 但是是很多複雜變
Enid avatarEnid2016-04-01
化中還有打劫的變化圖的話 可能他勝率就難以正確估算
Zenobia avatarZenobia2016-04-05
http://www.thenewslens.com/post/297239/ 我沒有要黑小
李 我只是想黑這篇報導而已XDD
Doris avatarDoris2016-04-08
原PO你意思是官子中如果也有劫爭電腦也會算不清嗎?
感覺也有可能耶 因為官子通常覺得電腦應該要很強...但如
果也有劫爭說不定又要爆了
Valerie avatarValerie2016-04-09
神手也不是說下就下得出來,小李78手可以發揮的形勢,至
少在左方白塊被強壓黑造就明顯外勢時還看不出來,要說是
Andrew avatarAndrew2016-04-14
刻意為之(蓄意造成78手的情形),小李除非有完成窮舉的實
力(也就是圍棋上帝),否則根本不可能辦得到。
Belly avatarBelly2016-04-15
今天的局面可能小李無心造成 但是如果有心引導 有機會
Bennie avatarBennie2016-04-19
因為一場打贏 其實大家也勾勒出AlphaGO的外型了
Xanthe avatarXanthe2016-04-22
就像古力快變成古力狗一樣 小李應該大多摸清了狗狗個性
Xanthe avatarXanthe2016-04-24
有心引導是一回事,但AlphaGo也不是紙紮的,也要真的能
次次應手都如李估計才行,這不窮舉達到圍棋上帝的境界根
Agnes avatarAgnes2016-04-27
本不可能。古力昨天也不是次次猜次次中啊。
Kyle avatarKyle2016-05-01
更別說昨天AG大自爆時,並不是判定劫爭應手不利,而是錯
估79應手的勝率。
Carol avatarCarol2016-05-05
目前可以利用的就 狗狗最愛避劫 愛及早定型 愛搶先手
Rachel avatarRachel2016-05-09
再推,我現在對於AlphaGo缺點的看法就是Vonix派XD
Rachel avatarRachel2016-05-10
是不是可以說要製造這種局面,然後之後如果都做出很好
的應對(像是白78,以及不犯錯)就有機會坐等自爆
Kama avatarKama2016-05-14
『製造局面讓電腦估錯,乘機爭取上風讓電腦自爆』之類?
因為讓電腦算錯 及 讓電腦自爆 不必然等同
Ina avatarIna2016-05-17
若是依這個邏輯,可能的勝點就只有「前盤保守避戰,還得
在盤面製造己身大量弱棋區(昨天有三塊弱棋),然後在中腹
中盤階段突然過份用強製造複雜(含劫爭)且要結構超過兩個
Regina avatarRegina2016-05-18
應對得宜應該是白完全不行
Quintina avatarQuintina2016-05-19
弱棋區以上的大戰才行。
這怎麼看都太難了。
Tristan Cohan avatarTristan Cohan2016-05-22
其實第三盤,阿發狗靠本身劫就贏劫爭,還很難說阿發狗有
沒有細算劫材的能力。
Rebecca avatarRebecca2016-05-24
耶~Nao大你說的不正是李世石拿手好戲嗎?XD
Ula avatarUla2016-05-26
李世石的拿手好戲是當對手是人時才有辦法刻意經營的,
Joseph avatarJoseph2016-05-31
現在的對手是「目前看來」不可能被對手刻意引導的AG耶
Emma avatarEmma2016-05-31
對手是人時,有棋風、前中盤勢弱區(和邏輯上弱區)的限制
,要利用對手的弱點、下棋的慣性去引導還比較容易,要刻
意在AG面前造就那樣的局面,若真可以的話,前三盤就不會
輸得這麼徹底。
Ina avatarIna2016-06-04
也不一定, 前三盤還沒有測出AG在甚麼情況下有可能爆掉
Annie avatarAnnie2016-06-06
而且今天四盤下來慣性也大概確定了 甚至爆掉後 習慣一樣
沒改 包括愛走掉先手 雖然會劫爭 但是先避再說 還有
Audriana avatarAudriana2016-06-07
老是愛自損定型
Hedy avatarHedy2016-06-09
所以我才說如果之後讓柯傑對戰阿發夠不公平 等於小李都
Kristin avatarKristin2016-06-11
幫他試出阿發夠的弱點了 然後給柯潔收成 若是弱點真的這
樣 給柯潔來下或者小李自己重新下5盤我覺得都是5:0或4:1
Heather avatarHeather2016-06-11
可是前三盤時的小李對alphago完全不了解,前三盤也算是繳了
學費吧
Megan avatarMegan2016-06-14
之後柯潔面對的說不定是betago了XD
Caroline avatarCaroline2016-06-16
怕就是怕都有小李給了五局經驗了,柯潔還是被0:5完結
Brianna avatarBrianna2016-06-20
若是如此,就代表阿發狗的bug只有在極端條件下才會被觸
發。(光是自我對戰3000萬局都沒發現有這bug,就夠離奇)
Ida avatarIda2016-06-24
先低調 明天很難說 第三盤的確有劫爭
但ag還是應對的很好
Jack avatarJack2016-06-27
(應該說沒有以容易紀錄的方式觸發這個bug?)
William avatarWilliam2016-07-02
等等 你怎麼知道3000萬局沒有bug?難道開發者有時間一局
局去看阿發夠自己下的時候有沒有爆掉?何況如果是他自己
Leila avatarLeila2016-07-02
李的確只贏一盤 只是電腦爆掉的下法
Olivia avatarOlivia2016-07-05
下 可能雙方都避開潔爭的變化 那也許也不會爆 但今天人
類來刻意引出這種變化就不一樣了 畢竟中盤高空戰要出現
劫爭的變化並不是什麼難事
Freda avatarFreda2016-07-08
工程師們也不是領乾薪的好嗎…
讓阿發狗自己去玩3000萬多局,工程師們都不用看這自我對
戰的記錄是否符合他們設定的演算機制?
Carol avatarCarol2016-07-09
連小學生都不如 這才是我失望的所在
Annie avatarAnnie2016-07-10
所以你覺得開發者有一局局看完?3000萬局?那我真的只能給
它們拍拍手
Audriana avatarAudriana2016-07-10
我覺得連小學生都不如這點,才是真的有趣的地方。
aja他們不可能不設計一個可以用來判斷(驗證)阿發狗計算
上有無失誤的驗證程式去跑吧 = = 若真如此,DM也太兩光
Poppy avatarPoppy2016-07-12
推NaoGaTsu,工程師可以寫出很多『壞棋偵測器』
Linda avatarLinda2016-07-12
壞棋有那麼好偵測我還研發阿發夠幹嘛
Carolina Franco avatarCarolina Franco2016-07-16
,設計一台人工智慧下棋機,卻沒有任何驗證程式去確保演
算法無誤?也太小看google的技術力了吧 = =
Hamiltion avatarHamiltion2016-07-17
不不,是存下棋譜之後偵測單步有沒有違反基本原則
Poppy avatarPoppy2016-07-19
除非阿發夠爆掉都一定會爆到像昨天那種初學者程度 但如
果只是稍微耍白癡 在職業眼中是爆掉 但業餘未必看的出來
sk7
呢?
Tristan Cohan avatarTristan Cohan2016-07-22
我在想,AG自爆後一樣按MCTS運算接下來的勝率落點,但對
手「無力應付」無理手的狀況,在一開始被減支後可能就變
成相對少數了,所以變成AG是一台「在劣勢時無法用強」的
Ina avatarIna2016-07-23
如果有壞棋偵測器 那我裝在AlphaGO身上就好 今天也不會
炸掉了 = =
Liam avatarLiam2016-07-25
譬如101手,應該不會很難偵測吧XD
Anonymous avatarAnonymous2016-07-26
機器,這樣就很有趣了。
說白了就是你讓阿發狗跑3000萬個數據群集出來卻沒有任何
Kelly avatarKelly2016-07-30
對阿 如果今天真有這壞棋偵測器 為啥不用來過濾阿發夠下
的棋?還是棋時開發者也對這壞棋偵測器沒有信心?
Ingrid avatarIngrid2016-08-01
工具可以分析大數據的正確性,這也太把以搜尋引擎起家的
大數據公司「始祖」看太扁了。
言而總之,aja他們肯定有辦法找出誤區,否則阿發狗也不
可能到87手就發現自己踩入誤區了。
Freda avatarFreda2016-08-02
AG的團隊中,不是只有aja比較懂圍棋嗎?人也沒有辦法每盤都看
Tracy avatarTracy2016-08-03
就我看來它們頂多從3000萬局中取出些樣本出來 然後請樊
Oliver avatarOliver2016-08-08
要用一些條件把這種所謂的bug濾出來, 或者叫AG回報
Dorothy avatarDorothy2016-08-12
麾之類的人去看有沒有明顯的壞棋
總而言之 如果它們有辦法找出誤區 那今天把他裝上去跟李
Oliver avatarOliver2016-08-14
= = 有技術開發人工智慧的公司還得用人力驗證是哪招啦
Oliver avatarOliver2016-08-16
AlphaGO是用圖形偵測 怕是到87手才發現整個圖很糟糕
Gary avatarGary2016-08-20
事實對弈 昨天的初學者棋步就不會出現了
Heather avatarHeather2016-08-25
是啊,AG到87手才找出誤區,但為時已晚,沒屁用啊。
至於為啥自爆後就變成15k的棋士,我上面有推論了。
Valerie avatarValerie2016-08-26
AlphaGO的大局觀就是圖形偵測來的 但是也因此失誤
Jacob avatarJacob2016-08-28
AG只是發現勝率驟降 勝率驟降一定是因為他自己突然下壞
棋?所有勝率驟降都是有小學生棋步出現?
Charlotte avatarCharlotte2016-08-28
目前看來最有可能的,就是AG一到大劣勢區就運作失能了
Tracy avatarTracy2016-08-29
AlphaGo可以說用圖形偵測嗎? 我理解那個只是類比@@
Harry avatarHarry2016-09-02
你問的問題只有等aja他們分析完資料才知道是不是了。
因為我們目前知道AG發生勝率驟降的案例只有這一次。
Ophelia avatarOphelia2016-09-02
你確定那3000萬局沒有?好 退一萬步說 就算它們真的有寫
壞棋偵測器 而真的可以準確偵測壞棋 但是那3000萬局也是
William avatarWilliam2016-09-05
因為AlphaGO在爆掉之後 還去逃右邊死棋 想圍起來
Doris avatarDoris2016-09-10
阿發夠自己在下 目前看來他很可能就是自己迴避劫爭 等於
他自己下的時候就會自己迴避這個bug 但人類誰跟你迴避劫
Iris avatarIris2016-09-11
所以我才懷疑 狗狗應該是用圖去感覺 造成大局觀
Anthony avatarAnthony2016-09-15
我不確定啊,我又不是DM的人。你能確定有?
Uizmp正解。阿發狗就算能偵測誤區的發生,但若是編程邏
Lydia avatarLydia2016-09-17
問題就在於今天這個種東西要怎麼回報, 回報後要怎麼修正
Joe avatarJoe2016-09-20
爭 並不是一定要下出劫爭 而是大型攻殺中有打劫的變化
我個人對於這個bug要修正不怎麼樂觀 因為這不是告訴阿發
Oscar avatarOscar2016-09-20
夠說你打劫的時候要多小心就好了 可能是要給他一個全新
的演算法去應付這種情形 而全新的演算法並不是那麼好開
發的 不是我程式哪裡寫錯改一下就好了
Cara avatarCara2016-09-24
輯出問題,阿發狗自己也無力修正啊。(例如是ValueNetwor
k給的權重錯誤或估算邏輯上編程錯誤)
Eartha avatarEartha2016-09-26
AlphaGO自我對奕 很多奇怪的bug反而會被隱藏起來
Olive avatarOlive2016-09-28
目前來看,AG是有辦法回報79手下錯,但是並沒有回報那些臭棋
Bennie avatarBennie2016-09-30
所以嘛,就不是有沒有自我偵測誤區的功能的問題,而是阿
發狗有沒有自我修正能力的問題(至少在這個bug上)。
moonlind,這將來就看得到了,AG要整台洗白從頭練起,
Joe avatarJoe2016-10-01
To moonlind & profyang,裝了也有不穩的風險,
要測試的話,可以容許壞棋偵測器誤判,實戰不行。
說不定測試時就都沒問題,所以就不裝啦。
Annie avatarAnnie2016-10-05
假設兩個笨蛋對奕 越對越聰明的可能性是?
Zanna avatarZanna2016-10-07
也不是說一定想不出來新演算法 但肯定不是稍微修改一下
然後neural net work重新train就好了
Dora avatarDora2016-10-09
所以一開始的AG會變成只知道圍棋規則的30K棋士。
Andy avatarAndy2016-10-11
另外就是為什麼87步時就發現錯誤之後還可以下出97這種棋
Necoo avatarNecoo2016-10-12
對阿 總之也許你們說的對 有裝壞棋偵測器 但這偵測器準
Valerie avatarValerie2016-10-15
因為圖形類比吧 成就了阿法狗的大局觀 但是...
但是一些對方好好應就會變成臭棋的點 無法自我debug
Ula avatarUla2016-10-18
不準我就很質疑了
而且就算準 阿發夠他自己的棋風也很可能導致他自己下時
迴避掉現在這種bug 那就算偵測器是準的也沒用
Emma avatarEmma2016-10-19
例如101手 可能有勝率 前提是李世石不鳥他 但人類怎可能
不鳥他 人又不是笨蛋
Yuri avatarYuri2016-10-23
另一個重點就是這個壞棋偵測棋到底要base on什麼原則去
判定?人類對好壞棋的原則?可是我怎麼記得幾天前人類覺得
Odelette avatarOdelette2016-10-28
的壞棋五路尖衝還被大大的稱讚?那壞棋偵測器應該要偵測
出這種棋嗎?
Catherine avatarCatherine2016-10-31
總之好壞棋的判定要化成程式碼我覺得很難 幾乎等於是寫
出半個阿發夠了
Kumar avatarKumar2016-11-04
profyang你說的有道理,確實可能知道有問題但是修不了
只是我從資訊產業的觀點,覺得如果知道不會那麼早約戰..
Elizabeth avatarElizabeth2016-11-05
像101這種壞棋,我覺得寫個判定棋還是可以的
不用很準,Aja或其他人可以從千萬盤抓出幾十盤來人工讀
Charlotte avatarCharlotte2016-11-09
而且棋時101要說是壞棋 是因為我們覺得他明明死了你還下
Todd Johnson avatarTodd Johnson2016-11-11
但說實在的這部棋有損很多目嗎?就官子來看頂多5~6目之類
Odelette avatarOdelette2016-11-12
真的筍比較多的我覺得反而是像93這種 外面還被94提掉 還
有97也是 更損 但是這種要判定就不像101這麼好判定了
何況以上這些"壞棋"如果今天剛好雙方正在打劫 那就叫做
Noah avatarNoah2016-11-14
找劫材而未必是壞棋了 這時又開怎麼判斷 寫個打劫條件判
斷式?可是有時候打劫也未必就一直在打 有時候打一打還會
Edward Lewis avatarEdward Lewis2016-11-18
擺著 這時到底算不算"打劫中"?
Mary avatarMary2016-11-22
為了打劫而下101不會對方剛提過劫才可能嗎? 我可能不懂
Agnes avatarAgnes2016-11-26
不過確實同意是有不少難處我沒想清楚@@
Hedy avatarHedy2016-11-27
一般找劫材確實要剛提過劫材可以 但是像剛才講的97這種
正常之下非常損的棋 但是如果有要打很大的劫 有時可能會
先來下97 這時不是單純的找劫材 而是製造劫材 因為97下
Agnes avatarAgnes2016-12-02
了白棋如實戰正常的下了之後 會產生更大的劫材
btw可是這場阿發夠確實在自己把打劫的變化削除了之後(91
才跑去97製造劫材 所以97才是壞棋
Zora avatarZora2016-12-06
有人說的很對 為何電腦會下101這種棋
Susan avatarSusan2016-12-07
難道自我練習的三千盤從為出現過?
Frederic avatarFrederic2016-12-07
我覺得ag劫爭的邏輯有問題
Leila avatarLeila2016-12-11
而且電腦不會有情緒問題 是不可能下錯
棋而自爆
Hamiltion avatarHamiltion2016-12-15
Alphago會不會面對業餘棋手更容易輸阿....
Elizabeth avatarElizabeth2016-12-16
有人說ag有學習能力 很多盤面都下過了
Ursula avatarUrsula2016-12-20
不曉得以現在的AG,打劫甚至連環劫分支在評價系統中怎麼評估
Rae avatarRae2016-12-21
但會犯這種錯誤頗無言 所以才推論
Mia avatarMia2016-12-25
ag無學習能力 而是用演算法走棋
Donna avatarDonna2016-12-27
看定義, 以自適應的方式調整演算法(落子法)叫不叫"學習"
Charlie avatarCharlie2016-12-27
有點想來整理一下 因為現在看來還是很多人沒搞懂
Leila avatarLeila2016-12-31
而且他的學習也不是看過就會 要數量夠大到影響勝率才會改
Una avatarUna2016-12-31
請先看一下 7779
Yuri avatarYuri2017-01-04
看ELO就知道了,業餘來下就是被alphaGO穩穩勝
Lydia avatarLydia2017-01-08
想太多...業餘棋手根本很難在阿發夠面前造成這種局面
Jessica avatarJessica2017-01-10
業餘就能簡單找出Bug 那叫黃士傑自己來就行了
Lydia avatarLydia2017-01-14
我覺得大家想太多,只要盤面太小無爭勝之處就會亂下了
Isabella avatarIsabella2017-01-18
下哪都會輸,所以要繳棋賭對方出錯,都應對都投子了
Oliver avatarOliver2017-01-19
只是前3盤領先落後不多才沒看到,我猜自我對亦時
師的alphago尾巴就會這樣下
Frederica avatarFrederica2017-01-23
所以李九段前期避戰是為了製造這樣的局面嗎0.0?
神78手 好像想了超過15分鐘的樣子??
Daph Bay avatarDaph Bay2017-01-24
profyang你有沒有什麼看法XD? 看了第五局白48開始,
我開始覺得你終究是對的,Deepmind可能沒有測試得很徹底
Sierra Rose avatarSierra Rose2017-01-27
+ AlphaGo本身棋風可能找不出這類bug
Suhail Hany avatarSuhail Hany2017-01-30
重新用科學家而不是棋迷的角度想,突然覺得更能理解XD
Belly avatarBelly2017-02-02
現在覺得Deepmind團隊就只是真的想來切磋學習@@
Susan avatarSusan2017-02-06