「戰勝自己」對於AlphaGo而言不只是口號 - 圍棋

Odelette · 2016-03-14

Table of Contents

Post
Comments
Related Posts

※ 引述《Tkuei (it's me)》之銘言：
: 這是台大資工林守德老師在他FB寫的一篇文章，是他看過Nature那篇論文之後寫的感想
: 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解
: 原文連結：https://goo.gl/m8cBHn (FB連結，不喜誤入)
小弟是programmer，也是業餘圍棋的愛好者，看了這幾天的直播，忍不住發一點自己的心
得。

我在看過論文以後，我覺得用更通俗的方法來描述AlphaGo，應該說他已經不是傳統上認定
的電腦AI，而是一個人，而這個「人」，靠著超強記憶力，在短短二年裡，經歷了可能千
年的玩棋歷程，有著超強的直覺。

他就從頭到尾用超強的記憶力，靠著直覺在下棋，甚至不懂規則。這意思是說，搞不好如
果有低等但神經元多且長壽的生物，我們把他抓來，把他的大腦接上電子訊號控制，把他
的視覺感官接成電腦棋盤，動作神經接鍵盤，讓他可以下棋，下得好給食物獎勵，下不好
給懲罰（AlphaGo的神經網路訓練是有獎勵，但是有沒有懲罰我就不知道了），也許這樣
的生物也可以練出不低的棋力，例如說章魚的神經元有五億個（人腦有1000億個以上），
專心練棋，搞不好比AlphaGo的運作成本還低XD

AlphaGo的價值或者說其恐怖，就是他已經具備類似人類的直覺，哪一天他要來畫畫還是寫
音樂，搞不好都有可能發生，你要說他有沒有情感，搞不好可能也算有了，就是在上一盤
他發現下錯棋，開始胡亂亂下，可能就是，也許AlphaGo以後應該作一個螢幕，顯示他認為
當下勝率多少，勝率高就是很開心的臉，勝率低就是苦瓜臉，當某一棋對手下出Alphago無
法應，亂硬的時候，開心的臉瞬間變苦瓜臉，你就知道他的情緒了。XD

其實應該作這個，才公平，因為李九段的心情情緒大家都看得到，可是AlphaGo的心情（勝
率）大家又看不到，這真的不公平。

跟AlphaGo不同的是，人類下棋是直覺跟邏輯並行的，好的職業棋手知道何時要切換，Alph
-aGo的狀況是，這一位「棋手」他不是邏輯不好完全依賴感覺行事，就是這一盤沒有掌握
到切換的時機，該拼邏輯的時候，他卻還在靠感覺，有點像是完全靠感覺開車，一但感覺
出錯，就歇斯底里，發生意外那樣XD

AlphaGo已經被訓練成這樣感覺派的了，昨天也不能說那是bug，比較可能說是一個「千年
老人」棋士下棋的壞習慣終於被抓到了。那將來Google的下一個圍棋人工智慧，BetaGo、
GamaGo會不會換不同的「訓練法則」，來訓練神經網路變出不同的棋風呢？值得期待。

一點心得分享XDXD

--
the First Order帝國軍莒光日主題歌：我們敬愛的達斯維達
https://www.youtube.com/watch?v=-iksyCHHIuI