「戰勝自己」對於AlphaGo而言不只是口號 - 圍棋

Table of Contents

※ 引述《Tkuei (it's me)》之銘言:
: 這是台大資工林守德老師在他FB寫的一篇文章,是他看過Nature那篇論文之後寫的感想
: 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解
: 原文連結:https://goo.gl/m8cBHn (FB連結,不喜誤入)
小弟是programmer,也是業餘圍棋的愛好者,看了這幾天的直播,忍不住發一點自己的心
得。


我在看過論文以後,我覺得用更通俗的方法來描述AlphaGo,應該說他已經不是傳統上認定
的電腦AI,而是一個人,而這個「人」,靠著超強記憶力,在短短二年裡,經歷了可能千
年的玩棋歷程,有著超強的直覺。

他就從頭到尾用超強的記憶力,靠著直覺在下棋,甚至不懂規則。這意思是說,搞不好如
果有低等但神經元多且長壽的生物,我們把他抓來,把他的大腦接上電子訊號控制,把他
的視覺感官接成電腦棋盤,動作神經接鍵盤,讓他可以下棋,下得好給食物獎勵,下不好
給懲罰(AlphaGo的神經網路訓練是有獎勵,但是有沒有懲罰我就不知道了),也許這樣
的生物也可以練出不低的棋力,例如說章魚的神經元有五億個(人腦有1000億個以上),
專心練棋,搞不好比AlphaGo的運作成本還低XD

AlphaGo的價值或者說其恐怖,就是他已經具備類似人類的直覺,哪一天他要來畫畫還是寫
音樂,搞不好都有可能發生,你要說他有沒有情感,搞不好可能也算有了,就是在上一盤
他發現下錯棋,開始胡亂亂下,可能就是,也許AlphaGo以後應該作一個螢幕,顯示他認為
當下勝率多少,勝率高就是很開心的臉,勝率低就是苦瓜臉,當某一棋對手下出Alphago無
法應,亂硬的時候,開心的臉瞬間變苦瓜臉,你就知道他的情緒了。XD

其實應該作這個,才公平,因為李九段的心情情緒大家都看得到,可是AlphaGo的心情(勝
率)大家又看不到,這真的不公平。

跟AlphaGo不同的是,人類下棋是直覺跟邏輯並行的,好的職業棋手知道何時要切換,Alph
-aGo的狀況是,這一位「棋手」他不是邏輯不好完全依賴感覺行事,就是這一盤沒有掌握
到切換的時機,該拼邏輯的時候,他卻還在靠感覺,有點像是完全靠感覺開車,一但感覺
出錯,就歇斯底里,發生意外那樣XD

AlphaGo已經被訓練成這樣感覺派的了,昨天也不能說那是bug,比較可能說是一個「千年
老人」棋士下棋的壞習慣終於被抓到了。那將來Google的下一個圍棋人工智慧,BetaGo、
GamaGo會不會換不同的「訓練法則」,來訓練神經網路變出不同的棋風呢?值得期待。


一點心得分享XDXD

--
the First Order帝國軍莒光日主題歌:我們敬愛的達斯維達
https://www.youtube.com/watch?v=-iksyCHHIuI
班長:每個人都要唱!大聲唱!

--

All Comments

Ida avatarIda2016-03-18
李40雖然情緒大家看的到 但是alphaGO又不看 這種情況下
把alphaGO的情緒顯現出來給李40看 才是不公平吧
Ula avatarUla2016-03-23
這個太超自然了啦...你要講也要連結到演算法吧@@
Victoria avatarVictoria2016-03-26
情緒看不看的倒不是重點 但是李世石情緒會波動 但阿發夠
其實就是根據你講的情緒來下棋的 這是他最大的優勢
Eartha avatarEartha2016-03-29
*李世石情緒波動會影響他下的棋的好壞
Eartha avatarEartha2016-03-30
那不是直覺 就是網絡架構加上已經訓練好的權重而已
其實google可以辦一場alphgo A跟alphgo B下棋 看會怎樣
Megan avatarMegan2016-03-31
辦了幾千萬場了,只是沒公開而已
Sarah avatarSarah2016-04-04
其實已經有AI可以製作音樂了,創作不再是人類所獨有
Una avatarUna2016-04-08
而電腦的電晶體數量很快就會追上人腦的神經元數量
Connor avatarConnor2016-04-10
現在的電子人腦思考速度大概是人腦的1/1000,如果摩爾
Michael avatarMichael2016-04-15
定律不變,大概40年後,電子腦就跟人腦擁有相同速度
Linda avatarLinda2016-04-16
^打錯,應該是20年後
Una avatarUna2016-04-20
應該給大家看不給李看
Hedda avatarHedda2016-04-21
同意樓上
Kelly avatarKelly2016-04-24
我也希望看到alphaGo的情緒,幫它做個臉吧 XD
Liam avatarLiam2016-04-27
對耶 給大家看好像不錯
Hedwig avatarHedwig2016-04-30
要做出情緒應該不難,勝率低時苦惱表情,高時輕鬆表情
Bethany avatarBethany2016-05-01
隨機亂數,偶爾做出跟勝率相反的欺敵表情,夠擬真了吧
Carolina Franco avatarCarolina Franco2016-05-05
看的懂的騙不了人
Lydia avatarLydia2016-05-06
看得懂的人才會對欺敵表情絕得困惑啊
Oliver avatarOliver2016-05-10
明明AG都快輸了為什麼表情一臉輕鬆,會想自己是否漏算
Steve avatarSteve2016-05-15
https://youtu.be/7Pq-S557XQU AI的介紹(有中文字幕)
Ina avatarIna2016-05-17
看完影片你會覺得自己快變成nothing了
Steve avatarSteve2016-05-17
人腦還是有效率很多,李世石下過的棋少電腦很多
Doris avatarDoris2016-05-22
樓上定義很怪,怎麼不說三個月就能贏九段的這種效率?
Barb Cronin avatarBarb Cronin2016-05-27
人腦反而沒效率吧,人腦最重要的事情是活著,光是這
Steve avatarSteve2016-05-31
項就要花1/3時間去睡覺,還要吃喝拉撒,就算在下圍棋
Jessica avatarJessica2016-06-04
用到的部分頂多就10%,其他90%zj負責生存
John avatarJohn2016-06-08
阿法狗就只做一件事就是算圍棋,而且不會死阿
Kelly avatarKelly2016-06-13
後面那幾手亂下對AG來說不是亂下,但對人來說是亂下
Olivia avatarOlivia2016-06-16
如果是亂下的棋,小李一一照應會不會很奇怪?他可以不理
Ophelia avatarOphelia2016-06-17
所以AG在賭小李不會應手,都應完,AG就投降了,因為沒棋
Caroline avatarCaroline2016-06-20
賭這種機率為0的棋,對人當然是亂下,但AG哪知道機率0?
John avatarJohn2016-06-22
AG有評估對方應手機率的函式嗎??
Elvira avatarElvira2016-06-27
我是說下幾盤棋可以到職棋
Zora avatarZora2016-07-01
所以一樣多的神經元不見得可以做到一樣多的事
Enid avatarEnid2016-07-06
越不接近暴力法就越有效率,像窮舉到類神經
Queena avatarQueena2016-07-07
你的解釋相當的有意思,完全靠「棋感」,而且看起像
細算的地方,其實也是靠感覺。
也就是看機率,說難聽一點就是:大概這樣下會贏。
David avatarDavid2016-07-09
是的這就是他演算法的主軸。
Catherine avatarCatherine2016-07-10
AlphaGo就是一個記憶力超強的賭徒,這種感覺