人類利用AI發掘的漏洞再度擊敗圍棋AI - 圍棋

Charlie avatar
By Charlie
at 2023-02-18T08:33

Table of Contents


先前板上也有板友分享相關論文

最簡單說 原理是訓練另外一組AI模型對抗式的去找出頂尖模型(Katago/Leela)的漏洞


現在的進度則是 棋力達到業餘頂尖的棋手有能力學習該模型的策略

反過來擊敗先前已經遠遠超過人類等級的模型 並且有穩定表現(KGS 14勝1負)

現在這個網站有棋譜可以線上閱覽

https://goattack.far.ai/human-evaluation


摘要

1. 這個鑽漏洞模型的對局下不贏尋常棋手(網頁第一譜)
2. 鑽漏洞策略精神之一:讓AI包圍自己,自己委屈兩眼活
3. 鑽漏洞策略精神之二:從外面偷偷包抄AI的包圍網,會發現AI的反應有點異常

成功的話就能反包抄AI原先的超厚勢


有趣的點

1. Leela 那一局,對抗者的114手在黑陣中掙扎,Leela 115 竟然是滑標級脫先?
感覺上是真的是一種漏洞...

2. Katago 那一局,對抗者86跳、88飛已經以客犯主。
AI 黑棋 97、101 連續照顧自己其他的疆界,結果上方對抗者的孤棋就這樣異軍突出,
完成了反包圍。
這一譜佈局時,對抗者的白棋在左邊與下邊的連續二線潛水很好笑,
另一篇報導中提到,這個反包圍策略需要「在其他角落行棋使AI分心」,
所以應是為此的準備。
報導:https://www.ft.com/content/175e5314-a7f7-4741-a786-273219f433a1

3. 大家應該想問,為什麼不對絕藝這樣操作?我也很好奇。

4. 現在球又被丟回來AI研究者這邊了,深度強化學習為什麼會出現這樣的盲點?
從圍棋領域內來講,看起來是對於自己的厚勢產生了超過常理的自信?
雖然從棋的內容來看未必符合大家期望的弒神的快感,
但這也是剛起步的機器智慧與掙扎的人類智慧的碰撞吧,也是一局很大的棋。



--
Tags: 圍棋

All Comments

Margaret avatar
By Margaret
at 2023-02-20T01:25
這樣下成功率有多高我很懷疑
Sandy avatar
By Sandy
at 2023-02-21T18:18
這種漏洞目前各類AI多少都有,像是圖片辨識的AI可以用
Hazel avatar
By Hazel
at 2023-02-23T11:10
雜訊攻擊,雖然人眼看不出來,但是AI就分不出了
Eden avatar
By Eden
at 2023-02-25T04:02
只能說,AI雖然很強了,但離真正大規模運用還有段路
圍棋AI無關人命,要是車用AI被攻擊,後果不堪設想
Catherine avatar
By Catherine
at 2023-02-26T20:55
簡單說叫做偷吃,或者說要製造超長氣的對殺
Genevieve avatar
By Genevieve
at 2023-02-28T13:47
故意過擬合 這很不容易
Blanche avatar
By Blanche
at 2023-02-28T04:32
簡單來說是故意往算法不適用的特例去走
Faithe avatar
By Faithe
at 2023-03-01T21:24
Overfitting 是 training 的事情,應該說是刻意找出已經存
在於 model 內的 overfitting 然後針對性地對抗
Mary avatar
By Mary
at 2023-02-28T04:32
當然也未必是 overfitting,單純的就是模型本來就沒有處理
Cara avatar
By Cara
at 2023-03-01T21:24
到也是可能
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2023-02-28T04:32
其實深度學習會有這種盲點對研究者而言是可預見的,這個球
Brianna avatar
By Brianna
at 2023-03-01T21:24
應該算是本來就知道的球,不是現在才丟回來的XD
Erin avatar
By Erin
at 2023-02-28T04:32
點進去看譜太爆笑,竟然允許填子自殺
Barb Cronin avatar
By Barb Cronin
at 2023-03-01T21:24
反正就是各種無下限攻擊讓AI精神錯亂是吧?
Odelette avatar
By Odelette
at 2023-02-28T04:32
這幾盤AI好像不會虛手?真怪
Ursula avatar
By Ursula
at 2023-03-01T21:24
難怪最後可以反讓AI 九子
Kristin avatar
By Kristin
at 2023-02-28T04:32
overfitting:訓練資料有涵蓋到的部份,但模型太過嘗試極
Connor avatar
By Connor
at 2023-03-01T21:24
端吻合每一筆測試資料,導致模型像是在背每個不同的答案而
沒有整合出共通規則
Charlotte avatar
By Charlotte
at 2023-02-28T04:32
但如果某些區域根本就沒有成功整理出規則,或者模型本來就
Carolina Franco avatar
By Carolina Franco
at 2023-03-01T21:24
參數量不足以解釋,根本沒有收斂成功,就 underfitting 了
Zora avatar
By Zora
at 2023-02-28T04:32
就比如那堆奇怪的下法,AI 自戰學習可能早早就覺得很爛,
Genevieve avatar
By Genevieve
at 2023-03-01T21:24
很快就不會在自戰挑選相關下法了,結果反而在那堆奇怪下法
Puput avatar
By Puput
at 2023-02-28T04:32
裡面找出複雜場面就可能突破,這沒有看到訓練時的數據就不
太確定會是哪種情況
Wallis avatar
By Wallis
at 2023-03-01T21:24
畢竟圍棋複雜度夠高,特定區域 underfitting 肯定是會發生
的,只是人類根本沒那個能力自己想出又亂搞卻又夠複雜的棋
Poppy avatar
By Poppy
at 2023-02-28T04:32
來攪出問題,結果還是需要靠沒有先入偏見的 AI 來挖問題
Kelly avatar
By Kelly
at 2023-03-01T21:24
只是因為這點就說 AI 圍棋不神,我覺得反而過度反應,事實
Regina avatar
By Regina
at 2023-02-28T04:32
上還是 AI 才擊敗了 AI,不然 AlphaGo 都已經八、九年了,
Kristin avatar
By Kristin
at 2023-03-01T21:24
如果隨便亂搞就能凹贏,怎麼不見哪個人直接出來宣稱自己研
究出了擊敗 AI 的方法XD
Freda avatar
By Freda
at 2023-02-28T04:32
另外,這種漏洞有可能不同模型不一樣,有可能絕藝就沒這一
Anthony avatar
By Anthony
at 2023-03-01T21:24
個洞。這跟訓練過程及模型容量都可能有關係。
Thomas avatar
By Thomas
at 2023-02-28T04:32
但終究這沒有改變 AI 就是比人還神的事實,人類靠了 AI 才
Enid avatar
By Enid
at 2023-03-01T21:24
勉強找到的打敗部份 AI 辦法,人家真的有心要解決,加大一
Lily avatar
By Lily
at 2023-02-28T04:32
下模型容量可能就又搞定了XD
只是搞定這些硬搞出來的贏法根本沒有什麼商業價值,現在
Kama avatar
By Kama
at 2023-03-01T21:24
AI 的主要定位本來就不是自己出來下棋而是輔助學習了,對
Kristin avatar
By Kristin
at 2023-02-28T04:32
人類完全無效的下法完全沒有商業價值,只是證明了設計 AI
本來就已經可以預想得到的事實而已
Emma avatar
By Emma
at 2023-03-01T21:24
有bug就要處理,讓圍棋AI變完美吧!
Olivia avatar
By Olivia
at 2023-02-28T04:32
對絕藝也能用哦,可以看看大橋拓文的推特
Emma avatar
By Emma
at 2023-03-01T21:24
有盲點很合理,畢境圍棋的狀態樹用整個宇宙存都存不下
區區一丁點大小的權重就想cover整個圍棋數學上就不可能
George avatar
By George
at 2023-02-28T04:32
也許你會覺得用業餘下法就能破解很不可能,但從數學上
講,就只是一條分枝而已
Ina avatar
By Ina
at 2023-03-01T21:24
我覺得可能就是引導到像這篇的盤面
Oscar avatar
By Oscar
at 2023-02-28T04:32
https://tinyurl.com/2p992r8w
Brianna avatar
By Brianna
at 2023-03-01T21:24
覺得有點搞笑,原po大概沒學過張量才會有這種強度三一
律的誤解
Rae avatar
By Rae
at 2023-02-28T04:32
要做出三個AI模型A穩定勝B,B穩定勝C,C穩定勝A並不難吧
,勝負本來就沒有遞移律
跟比速度的概念完全不同
Olga avatar
By Olga
at 2023-03-01T21:24
人類棋手也有棋風相剋的問題啊.....

圍甲總决賽首回合戰平 申真諝連笑輸贏皆

Sierra Rose avatar
By Sierra Rose
at 2023-02-17T23:44
圍甲總决賽首回合戰平 申真諝連笑輸贏皆意外 野狐圍棋 作者:古柯點擊:36272023-02-17 18:28 特約記者古柯報道 2月17日,2022“華爲手機杯”圍甲聯賽季後賽總决賽第一回合在成 都武侯區渝江飯店戰罷,五冠王蘇泊爾杭州與江蘇神獸腓腓戰成2比2平,雙方明天從零開 始進行决戰。同時進行的 ...

連笑圍甲決賽前看戰鷹直播學習

Carol avatar
By Carol
at 2023-02-17T08:16
戰鷹銳評連笑為何不趕緊衝 https://www.bilibili.com/video/BV1f84y1p7GQ/ 連笑坦言判斷失準 圍甲決賽前特地找鷹姐指點 鷹姐還謙虛說連笑不用來上課 有才有德 她真的我哭死 -- → a000000000: 那是假ee真cs刷題仔10/11 07:37 → ...

圍棋8冠王許皓鋐神之一手 盼讓台灣再登世

Cara avatar
By Cara
at 2023-02-16T23:40
圍棋8冠王許皓鋐神之一手 盼讓台灣再登世界巔峰 2023-02-15 18:41 中央社/ 台北15日電 回顧2022年的台灣職業圍棋,恐怕很難找到比「許皓鋐」3個字更合適的註腳。在國內不 限性別、年齡的9大職業頭銜賽事中,21歲的職業9段棋士許皓鋐獨攬了8座冠軍,同時以 新台幣850萬元的比賽總獎金, ...

繼AlphaGo後chatGPT爆火 圍棋人的未來何去

Olivia avatar
By Olivia
at 2023-02-16T23:39
【韓媒】繼AlphaGo後chatGPT爆火 圍棋人的未來何去何從? 野狐圍棋 作者:奶油小泡芙點擊:27122023-02-16 16:13 由openAI研發的機器人聊天程序chatGPT于2022年11月30日發布,是人工智能技術驅動的 自然語言處理工具,通過學習和理解人類的語言,可以像人類一樣聊 ...

世賽恢復面棋! Senko盃周泓余崔精上野愛

Mason avatar
By Mason
at 2023-02-15T23:58
【韓媒】世賽恢復面棋! Senko盃周泓余崔精上野愛咲美等出戰 野狐圍棋 作者:菜菜子點擊:18602023-02-15 16:01 隨著新冠疫情的結束,因疫情改在綫上進行的國際圍棋大賽將恢復綫下模式,以面對面方 式進行。 第五届senko cup世界女流圍棋最强戰成爲首個國際面棋世界比賽,該賽事將于 ...