「戰勝自己」對於AlphaGo而言不只是口號 - 圍棋

By Odelette
at 2016-03-14T15:12
at 2016-03-14T15:12
Table of Contents
※ 引述《Tkuei (it's me)》之銘言:
: 這是台大資工林守德老師在他FB寫的一篇文章,是他看過Nature那篇論文之後寫的感想
: 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解
: 原文連結:https://goo.gl/m8cBHn (FB連結,不喜誤入)
小弟是programmer,也是業餘圍棋的愛好者,看了這幾天的直播,忍不住發一點自己的心
得。
我在看過論文以後,我覺得用更通俗的方法來描述AlphaGo,應該說他已經不是傳統上認定
的電腦AI,而是一個人,而這個「人」,靠著超強記憶力,在短短二年裡,經歷了可能千
年的玩棋歷程,有著超強的直覺。
他就從頭到尾用超強的記憶力,靠著直覺在下棋,甚至不懂規則。這意思是說,搞不好如
果有低等但神經元多且長壽的生物,我們把他抓來,把他的大腦接上電子訊號控制,把他
的視覺感官接成電腦棋盤,動作神經接鍵盤,讓他可以下棋,下得好給食物獎勵,下不好
給懲罰(AlphaGo的神經網路訓練是有獎勵,但是有沒有懲罰我就不知道了),也許這樣
的生物也可以練出不低的棋力,例如說章魚的神經元有五億個(人腦有1000億個以上),
專心練棋,搞不好比AlphaGo的運作成本還低XD
AlphaGo的價值或者說其恐怖,就是他已經具備類似人類的直覺,哪一天他要來畫畫還是寫
音樂,搞不好都有可能發生,你要說他有沒有情感,搞不好可能也算有了,就是在上一盤
他發現下錯棋,開始胡亂亂下,可能就是,也許AlphaGo以後應該作一個螢幕,顯示他認為
當下勝率多少,勝率高就是很開心的臉,勝率低就是苦瓜臉,當某一棋對手下出Alphago無
法應,亂硬的時候,開心的臉瞬間變苦瓜臉,你就知道他的情緒了。XD
其實應該作這個,才公平,因為李九段的心情情緒大家都看得到,可是AlphaGo的心情(勝
率)大家又看不到,這真的不公平。
跟AlphaGo不同的是,人類下棋是直覺跟邏輯並行的,好的職業棋手知道何時要切換,Alph
-aGo的狀況是,這一位「棋手」他不是邏輯不好完全依賴感覺行事,就是這一盤沒有掌握
到切換的時機,該拼邏輯的時候,他卻還在靠感覺,有點像是完全靠感覺開車,一但感覺
出錯,就歇斯底里,發生意外那樣XD
AlphaGo已經被訓練成這樣感覺派的了,昨天也不能說那是bug,比較可能說是一個「千年
老人」棋士下棋的壞習慣終於被抓到了。那將來Google的下一個圍棋人工智慧,BetaGo、
GamaGo會不會換不同的「訓練法則」,來訓練神經網路變出不同的棋風呢?值得期待。
一點心得分享XDXD
--
the First Order帝國軍莒光日主題歌:我們敬愛的達斯維達
https://www.youtube.com/watch?v=-iksyCHHIuI
班長:每個人都要唱!大聲唱!
--
: 這是台大資工林守德老師在他FB寫的一篇文章,是他看過Nature那篇論文之後寫的感想
: 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解
: 原文連結:https://goo.gl/m8cBHn (FB連結,不喜誤入)
小弟是programmer,也是業餘圍棋的愛好者,看了這幾天的直播,忍不住發一點自己的心
得。
我在看過論文以後,我覺得用更通俗的方法來描述AlphaGo,應該說他已經不是傳統上認定
的電腦AI,而是一個人,而這個「人」,靠著超強記憶力,在短短二年裡,經歷了可能千
年的玩棋歷程,有著超強的直覺。
他就從頭到尾用超強的記憶力,靠著直覺在下棋,甚至不懂規則。這意思是說,搞不好如
果有低等但神經元多且長壽的生物,我們把他抓來,把他的大腦接上電子訊號控制,把他
的視覺感官接成電腦棋盤,動作神經接鍵盤,讓他可以下棋,下得好給食物獎勵,下不好
給懲罰(AlphaGo的神經網路訓練是有獎勵,但是有沒有懲罰我就不知道了),也許這樣
的生物也可以練出不低的棋力,例如說章魚的神經元有五億個(人腦有1000億個以上),
專心練棋,搞不好比AlphaGo的運作成本還低XD
AlphaGo的價值或者說其恐怖,就是他已經具備類似人類的直覺,哪一天他要來畫畫還是寫
音樂,搞不好都有可能發生,你要說他有沒有情感,搞不好可能也算有了,就是在上一盤
他發現下錯棋,開始胡亂亂下,可能就是,也許AlphaGo以後應該作一個螢幕,顯示他認為
當下勝率多少,勝率高就是很開心的臉,勝率低就是苦瓜臉,當某一棋對手下出Alphago無
法應,亂硬的時候,開心的臉瞬間變苦瓜臉,你就知道他的情緒了。XD
其實應該作這個,才公平,因為李九段的心情情緒大家都看得到,可是AlphaGo的心情(勝
率)大家又看不到,這真的不公平。
跟AlphaGo不同的是,人類下棋是直覺跟邏輯並行的,好的職業棋手知道何時要切換,Alph
-aGo的狀況是,這一位「棋手」他不是邏輯不好完全依賴感覺行事,就是這一盤沒有掌握
到切換的時機,該拼邏輯的時候,他卻還在靠感覺,有點像是完全靠感覺開車,一但感覺
出錯,就歇斯底里,發生意外那樣XD
AlphaGo已經被訓練成這樣感覺派的了,昨天也不能說那是bug,比較可能說是一個「千年
老人」棋士下棋的壞習慣終於被抓到了。那將來Google的下一個圍棋人工智慧,BetaGo、
GamaGo會不會換不同的「訓練法則」,來訓練神經網路變出不同的棋風呢?值得期待。
一點心得分享XDXD
--
the First Order帝國軍莒光日主題歌:我們敬愛的達斯維達
https://www.youtube.com/watch?v=-iksyCHHIuI
--
Tags:
圍棋
All Comments

By Ida
at 2016-03-18T20:33
at 2016-03-18T20:33

By Ula
at 2016-03-23T02:48
at 2016-03-23T02:48

By Victoria
at 2016-03-26T11:47
at 2016-03-26T11:47

By Eartha
at 2016-03-29T14:23
at 2016-03-29T14:23

By Eartha
at 2016-03-30T00:56
at 2016-03-30T00:56

By Megan
at 2016-03-31T23:10
at 2016-03-31T23:10

By Sarah
at 2016-04-04T07:46
at 2016-04-04T07:46

By Una
at 2016-04-08T03:01
at 2016-04-08T03:01

By Connor
at 2016-04-10T19:37
at 2016-04-10T19:37

By Michael
at 2016-04-15T07:53
at 2016-04-15T07:53

By Linda
at 2016-04-16T10:39
at 2016-04-16T10:39

By Una
at 2016-04-20T03:03
at 2016-04-20T03:03

By Hedda
at 2016-04-21T18:39
at 2016-04-21T18:39

By Kelly
at 2016-04-24T01:49
at 2016-04-24T01:49

By Liam
at 2016-04-27T14:31
at 2016-04-27T14:31

By Hedwig
at 2016-04-30T14:41
at 2016-04-30T14:41

By Bethany
at 2016-05-01T12:12
at 2016-05-01T12:12

By Carolina Franco
at 2016-05-05T04:45
at 2016-05-05T04:45

By Lydia
at 2016-05-06T17:50
at 2016-05-06T17:50

By Oliver
at 2016-05-10T14:53
at 2016-05-10T14:53

By Steve
at 2016-05-15T08:21
at 2016-05-15T08:21

By Ina
at 2016-05-17T06:23
at 2016-05-17T06:23

By Steve
at 2016-05-17T19:43
at 2016-05-17T19:43

By Doris
at 2016-05-22T08:51
at 2016-05-22T08:51

By Barb Cronin
at 2016-05-27T05:47
at 2016-05-27T05:47

By Steve
at 2016-05-31T21:56
at 2016-05-31T21:56

By Jessica
at 2016-06-04T00:51
at 2016-06-04T00:51

By John
at 2016-06-08T18:22
at 2016-06-08T18:22

By Kelly
at 2016-06-13T02:22
at 2016-06-13T02:22

By Olivia
at 2016-06-16T11:28
at 2016-06-16T11:28

By Ophelia
at 2016-06-17T01:23
at 2016-06-17T01:23

By Caroline
at 2016-06-20T19:16
at 2016-06-20T19:16

By John
at 2016-06-22T21:16
at 2016-06-22T21:16

By Elvira
at 2016-06-27T19:41
at 2016-06-27T19:41

By Zora
at 2016-07-01T21:29
at 2016-07-01T21:29

By Enid
at 2016-07-06T08:16
at 2016-07-06T08:16

By Queena
at 2016-07-07T13:40
at 2016-07-07T13:40

By David
at 2016-07-09T04:05
at 2016-07-09T04:05

By Catherine
at 2016-07-10T15:50
at 2016-07-10T15:50
Related Posts
今晚七點 人機大戰3.4盤實況

By Hedy
at 2016-03-14T14:53
at 2016-03-14T14:53
人機大戰第四局,神之一手降臨

By Zanna
at 2016-03-14T14:33
at 2016-03-14T14:33
人機對戰的熱潮後,要如何推廣圍棋呢?

By Elma
at 2016-03-14T13:59
at 2016-03-14T13:59
中日韓的民間圍棋風氣盛行度

By Dora
at 2016-03-14T13:54
at 2016-03-14T13:54
"駭客棋手"? 會有這現象 ?

By Thomas
at 2016-03-14T13:36
at 2016-03-14T13:36