科技進展對於圍棋的影響 (圍棋軟體歷史 & 突破的AlphaGo) - 圍棋

Todd Johnson avatar
By Todd Johnson
at 2016-03-11T20:12

Table of Contents


一樣,開頭先註明我是台灣業餘六段中間水平。

現在想要註明棋力的原因是因為自己本身是業餘棋手,加上版上小亂。

業餘評論總有相對於職業棋手不足的地方,所以分析上如果出了問題請多包涵。



這次的事情我僅僅想聊聊圍棋的部分,畢竟電腦這塊演算法等等的技術,對於一

個非資工相關科系的來說,要來解析已經是過於的專業了,希望大家互相尊重專

業。如今看到許多人是 圍棋人 評論 這程式、演算法該怎樣設計的鍵盤工程師,

但也有許多工程師對於圍棋並不熟悉,也在評論圍棋已經被電腦擊垮,但圍棋並

不是結果論導向的棋類,甚至有圍棋、演算法都不懂的人也來"參一咖"。但是我

今天還是看到幾位朋友也是努力的做好功課再來發問,而且態度誠懇。這種發問

只要我能力所及,我也很願意回復"圍棋"相關領域的問題。



根據以上,少數人僅僅以李世石被 AlphaGo 擊倒就說電腦圍棋已經征服棋界,是否

過於盲目?不只是圍棋,我相信許多棋類遊戲都並不是結果論的棋類,或許這部分

有些人不能認同我的觀點,包刮我的棋友也有些認為"輸就是輸了",但我最看重的不

是結果,而是那棋的過程、內容以及其趣味性。



今天對於李世石來說,是難得能稍作緩衝的一天...

對於我這小李腦粉,也是難得能來相較輕鬆聊一下我對 AlphaGo 的看法。


首先,看過我之前對 AlphaGo 的評價,想必大家已經知道 AlphaGo 第一次釋出的

樊麾版,與和李世石對弈的版本存在著極大的差異,但樊麾版的 AlphaGo 已經是

夠驚人了,更不用說和李世石對弈的 AlphaGo,那真是沒辦法想像。

還記得小時候我第一次接觸到的電腦軟體應該是西遊記,是民國 90 年左右的事情了,

那時候我剛學圍棋,大班~小一的年紀,我開始與一些電腦圍棋軟體對弈。


西遊記是一個以給小孩玩樂導向的棋類軟體,他的水平相對來說非常的差,所以也是

很適合給小孩來下,因為太難,小孩反而玩的興致缺缺。


以下請象棋人大概看看,如果不是象棋人可考慮忽略。

-------------------------------------------------------------------------
如果不能理解,請大家想想象棋軟體,其他棋藝軟體,在手機上都可以到達一定的水

平了,但是玩起來卻特別困難,原因是因為玩沒兩下就輸了,象棋軟體我舉例電腦版

的象棋巫師,水平大概已經有象棋的四、五段,對於我這個高中去玩個棋藝類社團,

一個月聽幾次社課就上段沒受過正規訓練的象棋初段玩家,象棋軟體已經是非常困難了。
-------------------------------------------------------------------------


而在學棋過程中,陸續出現了"烏鷺"、"CrazyStone"、"Zen"等各種版本,這也說明了

科技不斷的進步,我們甚至可以開始依賴電腦來學習一些比較有技術性質的技能,然而

當我們下到一定的程度,我們會開始降低和電腦圍棋對弈的次數,因為在那時候,電腦

圍棋往往有一些怪模怪樣的走法,不宜拿來分析、理解,所以我們開始改成使用"網路"

來練習棋藝,舉個大家通常都知道的例子:棋靈王的進藤光、佐為。



然而 AlphaGo 卻不同於以往的棋藝類軟體,他的怪招,不合理、不合邏輯的招數相對

較少,但你會說 AlphaGo 完全沒有不合理的棋步嗎?

當然不是,他還是有一些不合理的棋步,只是相對於以前市面上流通的圍棋軟體版本,

他的不合理棋步,相對的較少,而且它甚至開始顛覆一些我們對於棋類的理解。

黑嘉嘉說她對於 AlphaGo 贏了李世石很驚訝,但是更讓她驚訝的是,AlphaGo 居然是以

這樣的走法贏了李世石,或許 AlphaGo 會顛覆一些我們以前的認知也說不定。



小時候我印象我還是用撥接,還是 Windows 95系統,但是過一陣子出現了 XP,我開始

用線上棋藝軟體與大家對弈,記得第一次碰到的是 LGS ,甚至有些人碰到更早的軟體,

而國中幾乎沒下棋,後續高中我又開始用了棋城圍棋來上網與人對弈,就這樣從五段自

學升上了六段,這些都是科技發展對圍棋帶來的影響。從原本的來往棋社,變成了網路

上找老師、找對弈對手、陪練等等的。





接下來進入最近非常夯的 AlphaGo 正題



這次 AlphaGo 之所以讓人感到驚訝,甚至說害怕,其主要原因並不是它在棋類的感覺

已經超越了一流棋手,而是它吸收了許多一流棋手的棋譜,對於每位一流棋手的棋路都

有它一定的想法在,然而有些人說 AlphaGo 有了李世石那麼多的棋譜,而李世石僅僅有

AlphaGo 5盤與樊麾對弈的樣本,對於李世石來說這是非常不公平的。



一開始我也是這樣認為,但後來想想不太對...李世石這兩盤不僅沒什麼發揮,而且他下

的棋也與以往的他有了極大的不同之處,下棋的人通常稱之為:棋風。李世石大家常常

稱呼他是棋盤上的勝負師,原因是因為他對於勝負棋形的敏銳度更加高明。


但 AlphaGo 就算是有李世石的對弈樣本,面對上這次李世石的發揮,其實 AlphaGo 裡

面有李世石的對弈棋譜,應該也沒差才對。畢竟這兩次的發揮真的已經不是李世石的棋

風,如果真要說雙方有什麼不公平之處,就是李世石擁有 AlphaGo 棋譜的量實在太少,

所以這次並非 AlphaGo 熟知李世石行棋步調,而是李世石對 AlphaGo 了解太少。

這次李世石的行棋棋風,我個人是認為失去了勝負師的氣勢。



而這次 AlphaGo 真正贏棋的主因,還是因為李世石面對上了一個完全沒有情緒的機器。

而昨天,我與我高中象棋棋友聊到這次 AlphaGo ,那位象棋棋友啟發了我一個靈感,其

實 AlphaGo 的棋很保守,非常的龜。有點像是象棋的守陣,但它在保守之餘也不忘記對

對方"弱點"進行一定程度上的打擊,我認為這是這幾盤 AlphaGo 行棋上比較可怕的地方

,而 AlphaGo 如果真要談論它的棋風,它較為偏好實地。



我每次寫我觀戰 AlphaGo 棋譜的心得,基本上是不看職業棋士解說,而是以一個業餘身

分棋手來評論 AlphaGo 的棋,而寫完後我有時間可能會去看看職業棋士的解說,與我的

解譜有什麼出入在?我哪裡理解的還不夠好?而這次很訝異的是,我和某些職業棋手對於

這幾盤李世石的走法,都存在類似的疑問。如果對於這些判斷沒有錯誤的話,那可以說

李世石的棋已經犯下了不少"業餘棋手"都看得出來的失誤。



我以前打譜通常只打李世石、古力的棋譜,而李昌鎬和吳清源的或許也有打過,但不是那

麼認真的在打他們的譜,在打李世石的棋譜時,當他走出問題手,我也不太容易看出,往

往都要看解說棋譜仔細思考後,才能明白為什麼解說會說李世石的這手有疑問。




在今天中午吃午餐時,我把孟泰齡(泰哥)的講解看完,理解了一遍,然而我比較驚訝的是

泰哥的形式判斷,和我的判斷居然是差這麼的多。

http://i.imgur.com/QcljpmT.png

到這裡我已經覺得電腦至少小勝了,而泰哥卻說很不明朗,當時我不太明白難道我的判斷

有問題嗎?但後面泰哥的話讓我反覆的思考了一下。

http://i.imgur.com/LqmBwTf.png

泰哥到這裡說了,這裡 AlphaGo 淡定的虎了一手,他才發現原來 AlphaGo 領先了這麼多

那前面 AlphaGo 的行棋厚時都可以理解了。



而前面,我覺得 AlphaGo 已經至少有小優勢存在了,那為什麼泰哥職業棋手的判斷,會

判斷的差這麼多呢?仔細想了一下,想到我平常都在網路上下棋,沒事就會去按"形式判

斷",所以我認為自己的形勢判斷更較偏向電腦(會多算些虛空),不是人腦的形勢判斷,

通常人腦的形勢判斷,會稍微低估一些虛空。



這件事情讓我懷疑 AlphaGo 的形勢判斷是不是會有點類似市面上的圍棋軟體,所以導致

它一直是認為自己佔據優勢、主動的一方,其實可以看一下一些圍棋軟體的形勢判斷,

可以發現 AlphaGo 幾乎都是目數一直領先到底,而且被估算的空多。




最後,對於大家說的李世石是否有簽秘密條款,我不管怎樣都不會相信的,而會提出這些

想法的通常都是有一定棋齡的棋手,這些說法對於李世石也是一種不尊重。希望大家不要

再有這些對於目前無意義的猜測,等到總比數出來,再來聽聽看他們怎麼說吧。


--
Tags: 圍棋

All Comments

Edwina avatar
By Edwina
at 2016-03-16T18:44
西遊記 是說圍棋習遊記嗎XD
Anonymous avatar
By Anonymous
at 2016-03-19T03:57
恩...我想AlphGo並不會最形勢判斷這種事情 他不是由形勢
Mason avatar
By Mason
at 2016-03-21T04:57
判斷來決定下在虎那一手的 而是他覺得下在那邊勝率最高
Jessica avatar
By Jessica
at 2016-03-22T05:46
另外我很同意你說的 這場李世石沒有下出他的棋風 但是現
在很多人都在說因為阿發夠太強導致李無法發揮他應有實力
Eden avatar
By Eden
at 2016-03-27T04:53
對於這種想法我也只能表示無奈 好像阿發夠有超能力可以
催眠李一樣...
Ivy avatar
By Ivy
at 2016-03-27T16:21
所以說就是跟我們人類的邏輯不一樣嘛~
Barb Cronin avatar
By Barb Cronin
at 2016-03-27T22:34
有形式判斷
Tracy avatar
By Tracy
at 2016-03-30T15:36
http://zhuanlan.zhihu.com/yuandong/20607684
Isla avatar
By Isla
at 2016-04-01T07:43
很佩服你總是勇於發表自己的看法
Enid avatar
By Enid
at 2016-04-01T22:16
所以你要怎麼解釋第二盤已經到了大官階段落後10+目,卻連
右上的劫都不開?
Rae avatar
By Rae
at 2016-04-02T08:07
懷疑協定不是不尊重,可能恰恰是因為太清楚李的實力才會這
樣想
Ophelia avatar
By Ophelia
at 2016-04-04T15:15
論文裡沒有詳細說明局部評分使用的特徵
Ophelia avatar
By Ophelia
at 2016-04-04T22:21
所以和人類形式判斷相似度不知
Kristin avatar
By Kristin
at 2016-04-06T17:07
我的意思是白172改走173位
Ivy avatar
By Ivy
at 2016-04-06T22:54
一直不開劫真的是很費解 現在既然Aja出來闢謠了的話我是
比較傾向覺得李這盤有點太戰戰兢兢了 不敢放手一搏
Queena avatar
By Queena
at 2016-04-07T08:18
我覺得跟人對弈當然不會,可是和電腦AI則是一種嘗試
Hazel avatar
By Hazel
at 2016-04-08T00:10
已經進入讀秒
Kama avatar
By Kama
at 2016-04-11T20:58
飛刀也是鈍了QQ
Hedy avatar
By Hedy
at 2016-04-12T19:10
@TS13:論文有寫特徵啊,http://tinyurl.com/jyvk2y3
Xanthe avatar
By Xanthe
at 2016-04-16T04:37
48個channel
Cara avatar
By Cara
at 2016-04-17T00:52
就說是圍棋的工業革命啦
Sierra Rose avatar
By Sierra Rose
at 2016-04-17T06:16
那個是否算SL描述"整個"盤面的特徵,以決定下一手
Victoria avatar
By Victoria
at 2016-04-18T01:40
局部RL的部分Table 4就比較不詳細 (有錯請指證
Enid avatar
By Enid
at 2016-04-22T16:45
忘記小時候軟體名 當時讓電腦9子還是樂勝 比跟人下還無趣
Ivy avatar
By Ivy
at 2016-04-24T19:33
紅明顯 沒有所謂協議 alphaGo首席研發者之一出來澄清過了
Zora avatar
By Zora
at 2016-04-28T20:22
對goole來說 這種協議也沒意義 因為他們也想看電腦的判斷
Kristin avatar
By Kristin
at 2016-04-29T20:27
很好奇是否有可能人類過去的經驗導致低估了中央虛空的
Linda avatar
By Linda
at 2016-05-02T09:19
潛力,像第二盤黑37看似無太大用處,結果隨著戰局到最
Ophelia avatar
By Ophelia
at 2016-05-05T21:16
後不但幫助了左下兩子逃出也在右下中空區圍了不少地
Hazel avatar
By Hazel
at 2016-05-09T18:25
因為中央的討論太複雜了也沒有較有準則的指標,所以人
Candice avatar
By Candice
at 2016-05-13T16:45
們也較少的研究,也因為較少的研究就更不會去下他
Caitlin avatar
By Caitlin
at 2016-05-17T22:17
以這次人工智慧的程式演算法他不管邊角中央他都會去嘗
Heather avatar
By Heather
at 2016-05-21T18:01
試自我對奕時下下看,而經由大量對奕累積的數據對於在
Blanche avatar
By Blanche
at 2016-05-24T20:54
中央落子的效益可能會做得比較好
Ina avatar
By Ina
at 2016-05-29T05:51
中央的妙手 以前幾乎都是人類天才棋手的專利
Hedda avatar
By Hedda
at 2016-05-30T05:54
但是AG 的大量自我練習 可能讓他那邊變得很強
Daph Bay avatar
By Daph Bay
at 2016-05-30T12:58
我對圍棋西遊記有印象,小時候玩過XD
Donna avatar
By Donna
at 2016-06-01T23:04
在棋局某點開始重復對局N遍,一步有n1種可能,二步有n2可
能,...,直到棋盤結束,可能發展長得像樹,蒙地卡羅是隨機
Joe avatar
By Joe
at 2016-06-02T13:17
的意思,電腦不是強在分析,而是強在下個N(>10000)遍,找出
Megan avatar
By Megan
at 2016-06-05T15:01
某個落子是否勝算高,類神經網路可以幫助記憶這些結果
Anthony avatar
By Anthony
at 2016-06-06T02:55
啊... indium111 有寫了, 抱歉佔版面
Callum avatar
By Callum
at 2016-06-06T06:31
假如之後三場阿法狗還有臭棋的話可能真的要思考一下
Annie avatar
By Annie
at 2016-06-10T19:02
容許我再班門弄斧一下XD,想幫indium111從不同方向補充
首先,資工人的樹是頭下腳上的,根在上面,葉子在下面。
Regina avatar
By Regina
at 2016-06-13T22:00
讓我們簡化情況,假設有一個恰好30子之後會結束的棋盤,
輪到你而你執黑,對手執白。雖然有很多位置可以落子,但
Zenobia avatar
By Zenobia
at 2016-06-14T23:53
是你根據經驗判斷認為除了某兩子之外都是壞手不值得考慮
那麼『根』就是初始盤面,這個根有兩個『小孩』就是你下
Iris avatar
By Iris
at 2016-06-18T04:52
了那兩手以後分別得到的盤面。
Puput avatar
By Puput
at 2016-06-21T02:45
你下了一手之後換白子,假設你根據經驗仍然判斷白子只有
兩手不是壞手,那麼這兩個小孩就各自又有兩個小孩。表示
Ursula avatar
By Ursula
at 2016-06-23T18:52
你下了之後白子也應了一手的盤面。
所以第一層(根)有一個,第二層分叉2個,第三層分叉4個..
Gary avatar
By Gary
at 2016-06-24T08:17
到第30層就有2^29=約十億個,假設電腦能算的來。
Connor avatar
By Connor
at 2016-06-27T23:42
這時候這十億個就是『葉子』棋局到此結束(根據我的假設)
Adele avatar
By Adele
at 2016-06-30T18:30
現在怎麼"算"這些樹呢? 每個葉子要不是黑贏要不是白贏,
Jessica avatar
By Jessica
at 2016-07-02T01:28
所以每個葉子要跟他在第29層的父親說是誰贏了,由於第29
層是輪到黑子下,所以如果29層的盤面的兩個『小孩』有
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2016-07-03T09:17
任何一個是黑子贏,那這個盤面就標記為黑子贏。反之如果
兩個小孩都說白子贏,那就標記白子贏。
Blanche avatar
By Blanche
at 2016-07-07T04:46
現在回到第28層,第28層是輪到白子下,所以判斷方式相反
Cara avatar
By Cara
at 2016-07-09T04:23
如果兩個小孩至少一個說白子贏就白子贏,否則才黑子贏。
Bethany avatar
By Bethany
at 2016-07-12T22:26
於是這樣子從根出發,一路層層往下問(所謂遞迴),最後得
第2層的兩個盤面是黑子贏還是白子贏,然後你就選黑子贏
Genevieve avatar
By Genevieve
at 2016-07-17T07:47
的那個下啦XD,如果有的話。
實際上有好多困難: (1)不只三十步要算 (2)也不會知道只
Emily avatar
By Emily
at 2016-07-17T17:56
有兩個好手要考慮 (3)好壞手是程度問題,不能一刀切
Carolina Franco avatar
By Carolina Franco
at 2016-07-19T21:48
於是AlphaGo一方面要有強力的估計好壞手的能力,另一方
面不管估計能力多強都不可能做到上面那樣,所以要逼近,
Iris avatar
By Iris
at 2016-07-23T07:14
蒙特卡羅樹可以想成對上面的理想狀態樹的一種逼近。
Delia avatar
By Delia
at 2016-07-27T00:33
看AlphaGo的棋譜應該沒什麼用 他沒有習性 變動的速度太快
Isabella avatar
By Isabella
at 2016-07-27T23:05

可否更改alphago的設定

George avatar
By George
at 2016-03-11T19:35
我反而是認為和alphago下的話,圍棋規則要調整一下 來符合與電腦對戰的公平性 像是讀秒,到了這個時間點, 其實對電腦來說根本就沒差,但對人就影響很大 -- - ...

萬鋼稱象棋可嘗試人機對戰

Emily avatar
By Emily
at 2016-03-11T19:25
萬鋼回應圍棋人機大戰 稱象棋可嘗試人機對戰 還是喜歡人人對弈   對於怎樣看待正在火熱進行的圍棋人機對戰萬鋼說,昨天聽到這個消息也很高興,谷 歌的AlphaGo和李世石九段對弈,獲得了首場勝利。我國在超級計算機和人工智慧方面也 取得了發展,比如在地震模擬、大飛機設計、抗埃博拉病毒藥物篩選、宇宙起源模擬等方 ...

這兩盤棋 沒人會比李世石做得好

Xanthe avatar
By Xanthe
at 2016-03-11T19:23
依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了: 其一,在電腦判定的獲勝機率已經非常高時, 不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已, 而算法設計可能會讓非最佳解更容易被隨機挑到。 這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。 然而, ...

企業家想促成中國戰阿爾法 聶衛平願出山

Daniel avatar
By Daniel
at 2016-03-11T19:17
企業家想促成中國棋手戰阿爾法 聶衛平願意出山  新網長沙3月11日電 (通訊員 羅莎)北京時間3月10日,穀歌人工智慧AlphaGo與韓國 棋手李世石的五番棋第二局較量在韓國首爾四季酒店舉行,李世石執白再負,暫時以0:2 落後。 湖南鳳凰古城文化旅遊投資股份有限公司11日透露,該公司董事長葉文智希望能 促成 ...

朝鮮刷存在感 3萬神童欲稱霸世界圍棋

Isla avatar
By Isla
at 2016-03-11T19:16
人機大戰朝鮮刷存在感 3萬神童欲稱霸世界圍棋  中國網3月11日訊 據韓媒報導,韓國圍棋專業九段選手李世石與Google公司開發的圍棋 機器人“AlphaGo”對壘引發全球的高度關注。而近日朝鮮中央通訊社稱:“朝鮮國內有3 萬余名圍棋神童,其中就有10余名神童達到了專業6至7段的水準”。 據朝鮮中央通訊社 ...