科學視角解讀 AI3-5年內將贏遍人類棋手 - 圍棋

Yuri avatar
By Yuri
at 2016-03-12T16:16

Table of Contents

科學視角解讀人機大戰 AI3-5年內將贏遍人類棋手

 中新網北京3月12日電(記者王牧青)一場“人機大戰”,將人工智慧的話題推到公眾
面前,李世石連輸兩陣,更讓人對科技的發展瞠目結舌,甚至聯想 到《星球大戰》是否
真的會發生、人類會否被機器統治等問題。此時,我們不妨用科學的視角,理性而客觀地
看待人工智慧的現狀和未來。中新網(微信 號:cns2012)記者特別採訪了長期從事人工
智慧和智慧科學研究、來自中國科學院計算技術研究所的史忠植研究員,解讀“阿爾法圍
棋”和人工智慧的問 題。

  “人機大戰”為什麼選擇圍棋? 171位數“嚇死你”

  “人機大戰”的興起,最早是1997年,IBM超級電腦“深藍(Deep Blue)” 擊敗了
國際象棋大師加里-卡斯帕羅夫。科學界認為,圍棋“人機大戰”可以看成是人工智慧發
展具有標誌性的進展。曾經“深藍”的勝利鼓舞了人工智慧研究的士 氣,吸引了投資者
對人工智慧的興趣。

  至於為什麼選擇圍棋,史忠植教授解讀稱:“圍棋之所以很難被人工智慧攻破,戰勝
人類高手,就是其可能的組合數異常龐大。至於多麼異常,2016 年1月,普林斯頓的研究
人員給出了最新研究結果:對於一個19x19的圍棋棋盤而言,一共有361個位置,而每個位
置可以單獨放置黑棋、白棋或者留空,理 論上所有的可能組合是3361種。但根據圍棋規
則,不是所有位置都可合法落子,例如在圍棋術語中沒有氣的位置就不能落子。”

  “那麼,排除掉這些不合法的棋局後總共還剩多少種呢?普林斯頓的研究人員給出的
19x19格圍棋的精確合法棋局數:
   ‘

208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935
。’”

  “171位數!”這個數字比我們地球所有的沙粒數量還要多!比人類已知宇宙的所有
星球數量還要多!對比來講,穀歌學習的近萬盤人類棋局是5位 數,谷歌自行對戰的3000
萬盤是8位數,而圍棋所有可能的棋局盤數是171位數。如果規避還有可能的重複變化,把
大頭去掉,那也是70位數的棋局變化。

  2013年10月29日,史忠植在在創新驅動發展大資料時代的人工智慧高峰論壇上,提出
了智慧科學(人工智慧)發展的“路線圖”,並在著作《心智計算》一書中有詳細的闡述


  其中提到,2020年,人工智慧將實現初級類腦計算,即Elementary Brain Computing
。在這個階段,我們將實現的目標是電腦可以完成精准的聽、說、讀、寫;到2035年,我
們將進入高級類腦計算階段,即 Advanced Brain like Computing,那時,電腦不但具備
“智商”,還將擁有“情商”;到2050年,智慧科學(人工智慧)有望發展出神經形態電
腦,實現超腦計算,即 Super-brain Computing。到那個時候,電腦的高性能與人的高智
慧完美結合。

  史忠植認為:“按照這個標準,這次圍棋“人機大戰”中,若穀歌圍棋AI程式‘
AlphaGo’最終戰勝世界冠軍李世石,將說明人工智慧達到了初級類腦計算的水準。”

  “AlphaGo”如何工作?

  史忠植介紹,“阿爾法圍棋”下棋過程中主要通過四步完成工作,分別是:快速判斷
、深度模仿、自學成才和全域分析。

  其中,快速判斷,指用於快速的觀察圍棋的盤面,類似於人觀察盤面獲得的第一反應
。深度模仿,指“AlphaGo”學習近萬盤人類歷史高手的棋局來進行模仿學習,用得到的
經驗進行判斷。這個深度模仿能夠根據盤面產生類似人類棋手的走法。

  自學成長,指“AlphaGo”不斷與“自己”對戰,下了3000萬盤棋局,總結出經驗作
為棋局中的評估依據。全域分析,指利用第三步學習結果對整個盤面的贏面判斷,實現從
全域分析整個棋局。

  人工智慧經過60年的風風雨雨,取得了長足的進展,目前已在各行各業得到應用。史
忠植的《人工智慧》一書中,將其歸納為8個方面:專家系統、資料採擷、自然語言處理
、智慧型機器人、模式識別、分散式人工智慧、互聯網智慧和博弈。

  看到了“阿爾法圍棋”,人們自然聯想到中國的同類科技,目前能否達到甚至、超越
這一水準。史忠植介紹說:“在國家自然科學基金、973、863 和廣大企業等的支援下,
在廣大科研人員和應用單位的努力下,我國人工智慧幾乎與世界同步發展,特別在機器翻
譯、語音辨識、人臉識別、農業專家系統、資料挖 掘、深水機器人等方面是非常有特色
的,也有能力創造出戰勝世界頂級棋手的人工智慧系統。”

  人工智慧會否有朝一日能戰勝所有人類棋手?如果可以,大概需要多久?

  李世石接連落敗,柯潔甚至成為拯救人類圍棋智慧“尊嚴”的最後稻草。史忠植認為
,經過學習和積累,在未來3-5年人工智慧系統能夠戰勝所有的人類棋手。

  為何這台人工智慧如此厲害,不妨深究其內涵:“AlphaGo”的核心是兩種不同的深
度神經網路:“策略網路”(policy network)和“值網路”(value network)。它們
的任務在於合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制
在電腦可以完成的範圍裡。

 其中,“值網路”負責減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢
的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網路”負責減少搜索的寬度
——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。

  然後,將這些資訊放入一個概率函數,AI就不用給每一步以同樣的重視程度,而可以
重點分析那些有戲的棋招。“AlphaGo”利用這兩個工具來 分析局面,判斷每種下子策略
的優劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣。這樣,“AlphaGo”分
析了比如未來20步的情況下,就能判 斷在哪裡下子贏的概率會高。

  另據媒體報導,阿爾法圍棋採用機器學習方法,主要是深度卷積神經網路和強化學習
。研發團隊收集了圍棋職業高手大量的棋譜,並用這些棋譜對“深度卷積神經網路”進行
了3000萬步的訓練,使其判斷職業選手下一步走法的正確率達到了57%,之前的紀錄是44%


  (中國新聞網)

http://sports.sina.com.cn/go/2016-03-12/doc-ifxqhmvc2363252.shtml

今天看來人類已經戰勝不了了...

--
Tags: 圍棋

All Comments

Noah avatar
By Noah
at 2016-03-16T00:22
今天就證明人類棋手根本…
Wallis avatar
By Wallis
at 2016-03-18T04:09
就是三天前
Catherine avatar
By Catherine
at 2016-03-20T14:25
今天就可以了 不用三年QQ
Heather avatar
By Heather
at 2016-03-25T02:02
直接轉繁體也校一下稿好嘛
Mia avatar
By Mia
at 2016-03-28T07:16
人家洗文哪會管這麼多
Candice avatar
By Candice
at 2016-03-30T05:19
強國人文章不意外
Sandy avatar
By Sandy
at 2016-03-30T13:32
阿發狗 你哪時會成為天下第一啊
Susan avatar
By Susan
at 2016-04-02T02:06
合法棋局不知道有沒有包括吃掉一大塊然後在裡面繼續下
Hazel avatar
By Hazel
at 2016-04-02T06:20
https://youtu.be/aBpGkhEa2Qw 準備嚇尿吧...
Gary avatar
By Gary
at 2016-04-06T12:55
Jacob avatar
By Jacob
at 2016-04-11T05:45
這板又沒限制 當然可以洗好洗滿阿
Andrew avatar
By Andrew
at 2016-04-11T22:18
李世石已經是現在的世界第二,再擊敗柯潔就結束了
Gary avatar
By Gary
at 2016-04-14T00:29
zkow事蹟 https://goo.gl/jblHTo
James avatar
By James
at 2016-04-14T18:48
不要丟112 119的臉好嗎zkow

人機圍碁世紀大戰 - 3

Joe avatar
By Joe
at 2016-03-12T16:14
※ 引述《wjmd92 ()》之銘言: : 【點此看直播】https://www.youtube.com/watch?v=mCgYrwLGIqs : 用圍棋軟體跑一下第一盤,一般公認的黑79左下掛角,白80是緩招。 : 但是,當這手棋使黑棋勝率為39%,還算不算緩招? : http://i.imgur.com ...

alphago贏了

Charlie avatar
By Charlie
at 2016-03-12T16:14
AlphaGo三連勝 哇 歷史的一刻 - ...

想到一個贏電腦的方法了

Jacky avatar
By Jacky
at 2016-03-12T16:09
先不要想怎麼贏 如果只先想怎麼打平呢 我想這就是解法 不知道大家有沒有觀察到一件事 電腦思考的時間大約是80秒左右 但是如果時間用完 一步只有60秒 所以如果能把電腦時間耗盡 後半段它就會開始亂下 這就是沒有人察覺的「最大的弱點」 總思考時間為2小時 代表只要在電腦下約90顆時打到不分上下 基本上就贏定了 ...

人氣紀錄

Annie avatar
By Annie
at 2016-03-12T16:09
【板主:fish0407/staristic】李世石 0 vs 2 AlphaGo 看板《GO》 [←]離開 [→]閱讀 [Ctrl-P]發表文章 [d]刪除 [z]精華區 [i]看板資訊/設定 [h]說明 編號 日 期 作 者 文 章 標 ...

以後人類圍棋賽事的獎金

Daniel avatar
By Daniel
at 2016-03-12T14:58
※ 引述《tn00371115 (二代目月光仙子)》之銘言: : ※ 引述《solomn (九米)》之銘言: : : 假如這次電腦五連勝 : : 然後之後約戰其他人類高手 : : (柯潔、紅面、張栩、黑嘉嘉^^…) : : 電腦一樣全勝 : : 這樣政府or企業對人類棋士之間的比賽獎金贊助 : : 會不會減少 ...