三大原因促李世石首勝 ALphaGo演算法決定 - 圍棋

Ursula avatar
By Ursula
at 2016-03-13T22:30

Table of Contents

三大原因促李世石首勝 ALphaGo演算法決定其弱點

谷歌的“深思”團隊領頭人哈薩比斯第四局賽後在臉書上發文,稱到79手的時候阿爾法還
認為自己的勝率有70%,到了89手突然發現了問題,勝率判斷跌停式急劇下降……
  李世石在賽後新聞發佈會上說,阿爾法執黑時可能有困難,不能算錯誤,算是缺陷吧
……

  李世石取勝之道:後發制人 決戰中腹 導入複雜

  北京時間3月13日,李世石在人機大戰第四局弈出“神之一手”,扭轉乾坤,止住連
敗,贏回尊嚴。本局李世石的中後盤才像我們印象中的小李,以出人意料的銳利手段一戰
定勝負,正是他威懾棋壇的拿手好戲,“小李飛刀”終於重現江湖!反觀阿爾法,在妙手
面前招法混亂,一度表現得很業餘,讓大家對他的印象又回到了第一局之前,證明阿爾法
確實存在弱點,人類棋手與他對陣還不會是一邊倒。

  白78一落在棋盤上就被稱為“神之一手”,古力說“價值抵得上五局棋,年度妙手”
,很多人說必將載入史冊。我認為妙手不是人創造的,是一種客觀存在,只不過人們有幸
發現了它,而妙手的產生條件可以去營造……

  三局過後,人們(主要是職業棋手)對阿爾法的評價來了個大反轉,賽前多數棋手認
為李世石可以讓先甚至讓兩子,三局過後,有幾位世界冠軍表示阿爾法至少可以讓自己
一先,而韓國的世界冠軍金志錫誇張地說可以讓自己兩子。而給李世石出主意的也不少,
一些策略和猜測在今天的比賽中得到了一定的印證。

  結合第四局比賽,似乎發揮了作用的建議大致有四點:第一,阿爾法有“勢力範圍”
的感念,需要注意;第二,基於第一點,李世石不要主動定型,而是讓阿爾法主動出招;
第三點,電腦在封閉條件下的能力很輕鬆超過人,所以要在廣闊的非封閉區域,即中腹做
文章;第二局之後,朋友圈有篇文章說,以為同樣任職谷歌公司的美國電腦專家稱,阿爾
法在複雜計算方面不如人類棋手,這可以看做第四點。

  李世石在賽前不可能看過這些建議。但是不管李世石是自己想到了這些策略,還是無
意中實踐的,這幾點恰好是他今天獲勝的關鍵。

  1,連續隱忍 後發制人

  第四局前11手與第二局完全一樣,第二局公認的李世石在序盤有優勢,他再次採用這
個佈局很好理解。從白12雙方開始變招後,李世石下的很平和, 而阿爾法果然主動出招
了,但是黑23太出乎人們意料了,古力說,職業棋手就算在打劫時下出這手棋,也是不得
已的損招。但是因為出自三勝李世石的“阿老師” 之手,大家只能靜觀其變。

  古力認為白30和52都應該“秒斷”,然而李世石長考後都選擇了扳,這麼軟弱的招法
太不像李世石的風格了,以至於好友古力痛心地說“李世石的信心被摧毀了!”事後來看
,李世石的兩次隱忍為獲勝創造了條件。

  2,決戰中腹 神之一手

  白68繼續走厚實之招,李世石還在隱忍。柯潔認為黑69如果穩健一些跳在天元旁邊,
阿爾法將輕鬆四連勝,然而實戰的黑69也是符合人類審美和追求效率的一手。白70是李
世石逆轉的開始,落點在“天元”旁邊,符合上面提到的第二點“決戰中腹”的策略。阿
爾法的黑71再想穩健為時已晚,白棋做了 72-76的準備之後,白78已經成為客觀存在的妙
手,這閃電一“挖”一落在棋盤上,立即引起億萬棋迷的歡呼!即使最後仍然輸了,但這
一手仍然會載入史 冊!

  3,導入複雜 一戰定局

  讓阿爾法主動定型、後發制人是準備,把中腹營造成決戰戰場是發動,導入複雜計算
則是最後一擊!面對這人類根據棋盤上的圖形直覺,再加上多年實戰經驗得來的一手,
阿爾法低估了它的破壞力,黑79應對過於簡單,被白82一斷之後,阿爾法似乎完全懵了,
黑83以下不知所云,有幾招更是只有業餘中等水平。

  結合哈薩比斯公開的後臺資料,白78時阿爾法還渾然不知,等到89時突然發現中招,
之後的表現大失水準。

  李世石在賽後新聞發佈會上說,阿爾法執黑時可能有困難,不能算錯誤,算是缺陷吧
。中國規則貼7.5目,執黑需要主動出擊,這也印證了前面說的第一點。

  演算法決定弱點 阿老師軟肋不少

  阿爾法在第四局一度表現得非常業餘,證明阿爾法確實存在弱點,而這些弱點似乎是
程式演算法不好客服的。經過這麼多人工智慧專家這麼多天的洗腦,我 們知道阿爾法的
基本工作模式:(非窮舉式)搜索-(根據經驗)比較-(根據勝率)選擇,而它沒有邏輯
性,讓它出現一些人類不好理解的招法,以及劣勢下較為拙劣的表現。

  今天的比賽表明:1,阿爾法序盤的“天外飛仙”並不都是好棋,2,在中腹廣闊的非
封閉區域,它對人類根據圖像發揮想像力和創造力下出的手段應對偏弱;3,官子確實有
問題,只不過前三局優勢大被掩蓋了。

  開局不久,阿爾法下出黑23的驚人招法,實戰證明這不是第二局的黑37,是一招臭棋
。之後李世石是策略性的隱忍或是信心不足的退讓我們無從得知,總之阿爾法順利地領先
了。黑69撐得很滿,據柯潔判斷,此手如果穩健地條在“天元”上邊,能保證大空裡不出
棋,黑方簡明獲勝。實戰阿爾法對自己的棋型缺陷估計不足,李世石做了一番絕對的先
手交換後,白78圖窮匕見,這是讓觀戰者驚歎與亢奮的一手,就算阿爾法真的橫掃人類,
但只要他下不出這樣極具想像力和視覺衝擊力的妙手,那麼我們人類就不會服氣!

  黑79的應對已經無法避免出棋了,或許當白82“斷”的時候,阿爾法才發現問題的嚴
重性,黑83以下像是帶著情緒的發洩,黑97送死的招法虧損不少,黑101更是毫無意義像
是圍棋初學者的招法。如果阿爾法在第一局就走出這樣的招法,一定讓棋手們嘲笑並輕視


  進入官子階段後,阿爾法非但沒有像人類那樣放出“勝負手”,以求在劣勢下尋找翻
盤的機會,反而出現不少失誤,其實阿爾法在官子中不是“招招最佳”這點在前三局就體
現了,只不過當時它的優勢巨大,大家認為它是為了穩勝而放棄最佳招法。黑161又是讓
人嘲笑的低級失誤,阿爾法的失誤讓李世石優勢一 步步擴大,也讓他在讀秒聲中越來越
放鬆了。

  回顧第四局比賽,阿爾法在序盤出現黑23這樣目的不明的招法,中盤遭妙手打擊後章
法大亂,明明落後卻不知放勝負手,官子多次出現大大小小的失誤。這些表現與已經公開
的阿爾法的程式演算法有關,即阿爾法只是通過搜索-比較-選擇,來確定在哪裡落子,它
並不考慮落在哪裡最優,而只是不斷比較落在哪裡 勝率高,因此,阿爾法的這些弱點,
或許是程式演算法決定,不好客服。只要做到如下三點:1,不主動出擊,2,在適當的時
機把戰局導向中腹混戰,3,進入收官前保持優勢或者均是且官子中盡可能不失誤,人類
至少還能與目前版本的阿爾法旗有得一戰!

http://sports.sohu.com/20160313/n440282813.shtml

--
Tags: 圍棋

All Comments

Isabella avatar
By Isabella
at 2016-03-16T09:02
執黑有困難!?
Rosalind avatar
By Rosalind
at 2016-03-21T02:49
只會計算勝率沒辦法展現出人類的棋藝之美?
Vanessa avatar
By Vanessa
at 2016-03-22T15:07
當勝率為零和時無法計算?將會變成極度保守?
Callum avatar
By Callum
at 2016-03-27T06:14
第四局李世石贏五目半?
Quanna avatar
By Quanna
at 2016-03-28T21:11
覺得alphago執黑困難是李賽後訪問說的
Noah avatar
By Noah
at 2016-04-01T14:39
比起sky大的文章 我更信這篇 這中腹是小李挖給AG跳的
小李前面的退讓是策略 而且根據前三盤 選這策略可以預料
Tracy avatar
By Tracy
at 2016-04-02T23:51
單看第二盤 第三盤 第三盤早早開戰 體無完膚 反而第二盤
下得渾厚 勝機更多
Thomas avatar
By Thomas
at 2016-04-04T19:53
執黑有困難就第一手天元 然後後面當白棋來下不就行了
Tom avatar
By Tom
at 2016-04-05T00:31
貼目表示
Heather avatar
By Heather
at 2016-04-09T05:19
黑有7.5目要貼耶,你這種下法會死,所以AG不這樣下
Freda avatar
By Freda
at 2016-04-12T22:37
跟普通APP的AI下東坡棋都會輸2.30目了
Lydia avatar
By Lydia
at 2016-04-15T14:19
拼命po推文 是刷存在感的表現吧? 真實的世界裡,你究竟...
Daniel avatar
By Daniel
at 2016-04-16T20:03
但李執黑的話要貼目不可能不主動出擊
Gary avatar
By Gary
at 2016-04-16T21:20
一般人類是執黑比執白強,阿爾法卻是執白比執黑強
Callum avatar
By Callum
at 2016-04-21T14:40
是否表示貼7,5目有貼太多的嫌疑?
Enid avatar
By Enid
at 2016-04-23T10:49
等明天那盤棋下完再來討論貼目會更好
Lucy avatar
By Lucy
at 2016-04-24T05:53
哪來的一般人類執黑比執白強.........
Ophelia avatar
By Ophelia
at 2016-04-25T19:24
柯潔執白不敗傳說表示,原來柯潔。。。。

Alphago的弱點

Damian avatar
By Damian
at 2016-03-13T22:21
※ 引述《turing (涂妮)》之銘言: : 再看今天第78手後,發生什麼事情? : 明顯這個「神之一手」不在其策略網路之前估計的棋步中。 : 所以,之前所有值網路所估計的勝率全部報廢。 : AlphaGo必需全部重新計算勝率,而需要約五步的時 ...

請問為什麼中國韓國棋士不去日本發展?

Selena avatar
By Selena
at 2016-03-13T21:58
大家好 想請教一下 為何韓國跟中國的棋手不太去日本棋院發展呢? 台灣的張栩 王立誠不就去日本 陳詩淵 去韓國 趙治勳 柳時薰也是去日本發展 日本國內棋戰獎金豐厚 對局費又高 與其在國內被大李小李 常昊 古力夾殺 為何不轉台去日本大殺四方? 朴永訓 崔哲瀚要是去了日本 平成四天王大概只有張栩可以 ...

神之一手存不存在?

George avatar
By George
at 2016-03-13T21:49
※ 引述《lolylolyosu (3-1次元)》之銘言: : 如題 先說小弟下棋的經驗 : 之前偶爾會和公園老伯下軍棋 : 遇到的經驗都是 : 好棋=局勢剛好+對手沒注意到 : 換個很會下棋的老伯來 : 每一步都來個緊迫盯人 : 哪來的好棋給你下? : 圍棋... 有沒有人可以解釋一下? : 至於今天的阿發 ...

AlphaGo常見問題總整理

Andrew avatar
By Andrew
at 2016-03-13T21:41
大家好, 我這幾天看了很多資料和文章, 整理了一些關於AlphaGo的常見問題和解答, 希望能減少大家對AlphaGo的誤解。 如果認為我寫的回答有錯, 或還有什麼值得編進去的問題, 都歡迎推文告知, 我會盡快修改。 全文連結: http://roger0123.blogspot.tw/2016/03 ...

Alphago的弱點

Hedda avatar
By Hedda
at 2016-03-13T21:31
先簡介AlphaGo的原理, AlphaGo有兩個主要的分析網路, 1. 策略網路 policy network 在當前的局面分析可能下的棋點,並計算出現的機率。 例如:第二局的37手的五路肩沖的機率是萬分之一。 ...