加藤英樹談圍棋AI的過去.現在與未來(4) - 圍棋

Ophelia avatar
By Ophelia
at 2017-11-06T01:56

Table of Contents


加藤英樹談圍棋AI的過去.現在與未來(4)

http://koubokukei.blogspot.tw/2017/11/blog-post_4.html

DZG的特長

加藤:
其實圍棋這個遊戲,手順是非常重要的。好比說像下圖的攻殺,不要馬上A打,反而要
先從根本的B位粘住,然後再下A打,才是正確的手順。然而在模擬時,如果不花點心思
、不好好在程式上寫些東西,電腦就會很常出現上述直接A打的問題。其他像是反提或是
接不歸等型態,也必須加入檢查用的程式。像這樣的檢查工夫,在Zen的時代(未加入
VN、PN的時代)我們就加了非常多,這就是Zen強大的地方。也是靠著這些工夫,
才能強到可以在被武宮正樹九段讓四子還能獲勝的水準。不過,到了這個程度,我們就撞
牆了,從此進入了冰河時期。甚至到了讓尾島先生想停止開發的程度。

星合:
也就是開發的動機不見了啊。

加藤:
就在此時,阿發夠出現了。

星合:
這就和尾島先生讀了阿發夠論文之後想去拜託多玩國公司的事情連了起來了呢。

大橋:
將蒙地卡羅搜尋樹、PN、VN結合起來的DZG在接近戰上也還是非常強,應該也是前
述的功夫發揮了作用的關係吧。

避戰的阿發夠

星合:
這樣我多少理解電腦圍棋的架構了。但與DZG相比,阿發夠的特徵又是甚麼呢?

加藤:
如果仔細咀嚼股溝公司的論文的話,就知道這個程式是用絕對不會往自己不擅長的地方走
的方向來寫成的。

星合:
所以阿發夠也是有不擅長的地方?

加藤:
具體來說,就是因為一手之差而導致勝負翻轉的局面。

星合:
意思是戰鬥或攻殺嗎?

加藤:
並不是指全局而是可能會造成「翻轉勝負」的攻殺或戰鬥。像這樣的局面,阿發夠會評價
成「不利的局面」,而阿發夠的VN就是根據這個原則來做成的。這也許會被看成是不敢
正面對決的狡猾做法,但其實人類本身也是會用避開自己不擅長的局面而想轉往自己擅長
的局面的方式來下呢。

星合:
原來如此。雖然它是避開不擅長的攻殺或戰鬥,但結果上卻是用人類視角來看,變成了具
有高度大局觀的下法呢。我一直有AI具備了強大細算能力的印象,其實是根本相反的啊


加藤:
圍棋AI總是用全局的角度來檢視,其實是無法像人類那樣集中在某個局部來深入細算的


大橋:
人類是一面俯視全局、一面根據需要進行局部的細算,這其實是AI還沒辦法做到的。

加藤:
像這種靈活切換大局與局部的能力,不僅是圍棋而已,其實也是所有領域AI設計的課題


如果DZG和阿發夠一戰的話...?

加藤:
AI和人類下棋時,是利用VN盡量在佈局階段領先,然後一路維持優勢到底的下法。然
而在圍棋AI程式對戰時,由於彼此的佈局都很強,就很難在一開始拉開差距。因此,就
變成了中盤的戰鬥力才是勝負的關鍵。在世界電腦圍棋公開賽時,因為DZG在預賽中分
別輸給了CGI與絕藝的關係,所以在決賽時故意調降了VN的比重,而把模擬的比重提
升而使中盤戰鬥力加強起來。因為一如前述,DZG在模擬中的戰鬥能力上花了很多心血
,這也是我們長期開發累積出來的成果。最近才開始開發的圍棋AI並沒有這一塊,所以
就算是把VN比重下調,也無法讓戰鬥力變強。

星合:
那阿發夠與DZG到底何者比較強?

加藤:
這就不知道了。就像前面說過的一樣,能勝過人類並不代表能勝過其他圍棋AI。如果將
CGI、絕藝一起加進來下循環賽的話,阿發夠說不定也會輸掉。在這方面,因為DZG
在中盤的戰鬥力做的不錯,在這方面上有一定的好處。所以關鍵就在於在佈局階段會有多
少差距了。

--
Tags: 圍棋

All Comments

Rebecca avatar
By Rebecca
at 2017-11-10T16:28
好有自信
Sarah avatar
By Sarah
at 2017-11-11T19:27
就像王元均知道自己比柯潔差一些,但還是能下一下
Tom avatar
By Tom
at 2017-11-12T03:20
現在肯定贏不了AG 但AG停止開發了 幾年後有機會超越
Linda avatar
By Linda
at 2017-11-14T19:15
絕藝現在應該要更壓倒性啊
絕藝 零
Poppy avatar
By Poppy
at 2017-11-16T19:34
alphaGO master不是自戰過那種超複雜攻殺的嗎?
Bethany avatar
By Bethany
at 2017-11-20T15:15
私心認為 DZG對上alphaGO master應該是拼不贏
Dora avatar
By Dora
at 2017-11-23T02:42
這邊的alphago應該不包含master版
Wallis avatar
By Wallis
at 2017-11-26T14:09
master 應該是很愛超複雜攻殺的
Anonymous avatar
By Anonymous
at 2017-11-30T07:34
跟master攻殺根本找死
Jessica avatar
By Jessica
at 2017-12-04T22:59
雖然我也不認為攻殺上AlphaGo會落下風,但加藤先生說法也
Wallis avatar
By Wallis
at 2017-12-08T05:09
有道理,Deepmind目標是在通用AI,不像Zen針對圍棋作太多
Rebecca avatar
By Rebecca
at 2017-12-08T07:37
演算法優化,但是這些優化在足夠訓練量面前是否有優勢就
難說了(甚至有可能因overfitting而變弱)
Enid avatar
By Enid
at 2017-12-09T12:38
設計太多頂多lee級,看過zero用一堆人類眼中的利用屠爆ma
ster 中腹,少打多反屠master;master自戰可是超多擴及全
盤互攪的攻殺。拿人類的手順、思維要設計神??!
Susan avatar
By Susan
at 2017-12-13T05:25
阿法狗是軟硬體結合開發的,DZG只是軟體
Skylar Davis avatar
By Skylar Davis
at 2017-12-14T17:18
如同iOS與a系列處理器都由apple設計就完爆,android
Enid avatar
By Enid
at 2017-12-16T01:15
master不跟你攻殺,理由不是自己弱,而是你不夠強...
Cara avatar
By Cara
at 2017-12-19T03:15
更別說Zero了,DZG對上ZERO肯定要吃土的...=.=
Jake avatar
By Jake
at 2017-12-22T13:22
我覺得DZG 應該連master都打不贏
Faithe avatar
By Faithe
at 2017-12-24T07:08
其實這文出刊前,雜誌社應該要跟受訪人再次確認一下...
Catherine avatar
By Catherine
at 2017-12-27T17:04
不然這樣誇誇其談,實在是對人的形象不太好...

加藤英樹談圍棋AI的過去.現在與未來(3)

Ingrid avatar
By Ingrid
at 2017-11-06T01:51
加藤英樹談圍棋AI的過去.現在與未來(3) http://koubokukei.blogspot.tw/2017/11/blog-post_3.html 使用蒙地卡羅法來模擬 大橋: 到深度學習出現為止,電腦圍棋是以蒙地卡羅法為主流吧。 星合: 何謂蒙地卡羅法? 加藤: 蒙地卡羅原本是摩納哥非常有名 ...

alphago繼續發展下去

Genevieve avatar
By Genevieve
at 2017-11-05T01:45
※ 引述《forgetta ( )》之銘言: : 想請教問關於水平線效應的問題 : 之前會聽說哪個版本的AG可以讓哪個版本幾顆 這些對戰是怎麼來的? : 因為王銘琬老師的書中有寫到水平線效應 : 如果AI勝率太低的時候會開始亂下追求翻盤的機會 例如對李世石的比賽就有出現 : 但如果是讓兩子開始下 為什麼不會一 ...

alphago繼續發展下去

Isabella avatar
By Isabella
at 2017-11-05T01:01
想請教問關於水平線效應的問題 之前會聽說哪個版本的AG可以讓哪個版本幾顆 這些對戰是怎麼來的? 因為王銘琬老師的書中有寫到水平線效應 如果AI勝率太低的時候會開始亂下追求翻盤的機會 例如對李世石的比賽就有出現 但如果是讓兩子開始下 為什麼不會一開局就出現水平線效應 而還可以授子獲勝? (例如讓兩子 ...

2017年度台灣十大圍棋新聞票選活動

Yedda avatar
By Yedda
at 2017-11-04T19:49
2017年度台灣十大圍棋新聞票選活動 又到年終盤點時刻了! 按慣例票選台灣十大圍棋新聞。 弈棋站十大新聞的產生流程 : [第一階段-圍棋新聞舉薦] (自即日起至2017.12.31止) 推舉人:全體站友(含PGS站、PTT等網站站友)。推舉新聞條數:無限制。 [第二階段-新聞投票活動] (2018.0 ...

alphago繼續發展下去

Sierra Rose avatar
By Sierra Rose
at 2017-11-03T21:09
alphago李 --andgt; master --andgt; alphago zero 發展是爆炸性的快 圍棋理論上是零和遊戲 (因為有貼半目) 一般情況下不是黑贏就是白贏 目前alphago內戰是白有利 雖然圍棋的變化性非常非常多 但隨著alphago一直跑下去 中間儲存的記憶點變多 有朝一日 ...