人機大戰觀後雜感 - 圍棋

Hedy avatar
By Hedy
at 2017-05-28T15:09

Table of Contents

※ 引述《Maybetrue (電子黑手)》之銘言:
: ※ 引述《hdjj (hdjj)》之銘言:
: 是一個災難。比如說我們拿AG管理雙北市的紅綠燈,我們希望AG管理的紅綠燈讓交通更
: 順利,結果一個突如其來的災難,讓AG耍憨了起來,搞得全雙北市的紅綠燈通通在亂閃
: 。這是絕對不可以的。以上週團體賽的結果來說,古力那一邊的Alphago 就是在耍憨,
: 而且Alphago 不是軟體工程師key 出來的函數庫,它是自我學習的整體。我猜目前
: deepmind並沒有能力修改AG讓他能在逆境採取積極對策。因為如果去年AG被李世石挖到
: 發瘋,今年重新再次自我學習應該也要把這一點改掉,但是結果並沒有,只是用強大的
: 能力掩蓋這個弱點而已。只要有個人類 (豬隊友?)在旁邊作亂,AG個體能力再強也要發
: 瘋。但是,AG發瘋是不被允許的。事實證明,AG如果傻掉,能力比常人還差。套用到更
: 大的系統面上去的話將會造成毀滅性災難。

簡單說一下原PO所說的問題點
目前deepmind的AG,在正常運作下沒有問題

但發生意外,或突發狀況時,AI並不會讓損失減到最小,而是開始錯亂...

沒人可以保證完全不出任何意外,
但如果AI只有正常運作下沒有問題
當有外力介入,產生意外時,AI並不能讓損失控制到最小,並且產生錯亂...
這是AG要解決的下一步問題..
----
以自動駕駛為例,當AI判斷需要立刻停止(投降),
但人類強制繼續運行並且依靠AI進行後續判斷(古力不同意,但又不能全面接管)
此時AI開始產生錯亂(亂下),導致後續應減少損失的局面,反而擴大
這是目前AG的不穩定因素之一

雖然在不同場合,可能不會發生,但現實生活中就因為這萬分之一的意外情況,
產生重大傷害

跟目前寫好的程式一樣,一但發生程式預期以外的情況是無法處理的.
--
Tags: 圍棋

All Comments

Genevieve avatar
By Genevieve
at 2017-06-02T10:28
不曉得虛竹那種自殺招能不能讓AlphaGO錯亂XD
Margaret avatar
By Margaret
at 2017-06-02T14:16
我覺得控制權切來切去,現在的飛機自動駕駛可能也會有問題吧
但不代表這東西不能用,只代表你不能頻繁的切來切去而已
Steve avatar
By Steve
at 2017-06-02T17:53
要控制損失就訓練時給他其他條件就好阿,比方說放棄點勝率
可是要求輸的時候要輸最少
Rosalind avatar
By Rosalind
at 2017-06-04T20:27
你要AI符合你想的去做,你給他的條件目標就要明確
Ethan avatar
By Ethan
at 2017-06-07T09:39
現在是條件太單純:勝率極大+贏 他一切行為當然就照這個
Annie avatar
By Annie
at 2017-06-11T02:51
如果賭錢,一目一千,AG大概都是把把都贏一點點那種是吧
Sierra Rose avatar
By Sierra Rose
at 2017-06-11T04:58
AI量產之後的確不會具備學習功能 AG也沒有邊下邊更新
Elma avatar
By Elma
at 2017-06-13T16:57
不受控制的學習是很危險的,應該是廠商統一處理
Charlie avatar
By Charlie
at 2017-06-16T18:18
勝率低會那樣就是你給的條件問題啊,你要他特殊情況符合你
Candice avatar
By Candice
at 2017-06-20T01:59
期待你就得給他其他條件阿,這不是基本邏輯嗎?
他是機器不是神,他還是照你給的腳本去學的阿:D
Selena avatar
By Selena
at 2017-06-24T07:39
這是目標函數的問題,勝率就代表不管輸得多慘就是一敗
Dorothy avatar
By Dorothy
at 2017-06-28T16:51
其實人類世界也有,比如說棒球比分差太多就派野手上去投
Zora avatar
By Zora
at 2017-06-30T08:36
這時就只求結束比賽,不會想再去縮小分差了. 俗稱垃圾時間
Todd Johnson avatar
By Todd Johnson
at 2017-07-03T05:11
總之,你想要怎樣的行為,就採用相應的目標函數,並且把各種
Rae avatar
By Rae
at 2017-07-05T12:31
極端狀況該如何處理放入訓練資料,練出來的才會是你想要的
Edward Lewis avatar
By Edward Lewis
at 2017-07-06T20:37
現在就是他的訓練目標是A,你說他B的時候不行,改變的方法
Elizabeth avatar
By Elizabeth
at 2017-07-07T09:54
是把訓練目標改成f(A,B), 一個綜合考慮A跟B的函數
Ophelia avatar
By Ophelia
at 2017-07-10T22:29
如果能自始至終,完全鬥狠,不下緩著的阿法狗,會精彩
許多!
Todd Johnson avatar
By Todd Johnson
at 2017-07-14T10:37
AI互下的譜很多都很狠,互相殺龍XD
Genevieve avatar
By Genevieve
at 2017-07-17T22:59
你怎麼不懂...人家目標就是贏,你又要人家少輸
Noah avatar
By Noah
at 2017-07-18T14:07
減少損失又不等於創造贏的機會
Ina avatar
By Ina
at 2017-07-23T08:23
那樣代表你程式沒寫好,回去重寫,AI沒有好壞XD
Lauren avatar
By Lauren
at 2017-07-26T17:50
為啥跳到討論自動駕駛拉= = 到時候AI學習又是別的方法拉
Kumar avatar
By Kumar
at 2017-07-30T00:47
事實就是AI圍棋已經無敵 以後開發出的自動駕駛也會比人
自己開安全
Todd Johnson avatar
By Todd Johnson
at 2017-08-03T05:43
歹稍微瞭解一點深度學習是什麼…
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2017-08-07T17:16
自動駕駛來說你在訓練階段就要加入突發事件讓他學啊
Emma avatar
By Emma
at 2017-08-08T08:21
感覺一直在鬼打牆,又沒人說AG要去開車,AG也不是唯一的AI
Caitlin avatar
By Caitlin
at 2017-08-09T10:05
把目標函數換一換行為就會差很多,一直拿AG的行為去推演幹嘛?
Connor avatar
By Connor
at 2017-08-11T14:19
等著看阿爾法AI學打星海,那才是自駕這樣不完全訊息的類比
Dorothy avatar
By Dorothy
at 2017-08-16T09:16
至於拿圍棋訓練的AI比自駕根本不能類比
Una avatar
By Una
at 2017-08-19T00:45
用想像的你要不要去看一下網頁
Callum avatar
By Callum
at 2017-08-20T04:26
https://waymo.com/ontheroad/
實際上路測試就是在train. 理論上只要樣本數夠
Elma avatar
By Elma
at 2017-08-20T13:58
你想像得到的狀況都會在裡面
Belly avatar
By Belly
at 2017-08-23T13:11
另外還有一些其他的專利goo.gl/5xQrxX
Kelly avatar
By Kelly
at 2017-08-24T13:15
真實上路前鐵定train了一般人一輩子都達不到的里程數
如果還有發生無法處理的情況(飛機掉下來之類的)
Mason avatar
By Mason
at 2017-08-28T02:50
我跟你說AI處理不來的人只會更差....
反正你要比出事率的話, 自動駕駛的出事率絕對比人低的
Selena avatar
By Selena
at 2017-08-30T09:54
多, 你來矽谷待久一點, 就可以看到無人車開來開去
Eartha avatar
By Eartha
at 2017-08-30T12:59
看到無人車比看到美國三寶開車令人安心多了
Thomas avatar
By Thomas
at 2017-08-31T13:21
你知道AG要拿去作什麼了?
Franklin avatar
By Franklin
at 2017-09-05T04:34
自動駕駛就是目標函數的複雜度更高啊,你一直拿圍棋的目標
函數訓練出來的結果談自動駕駛根本就錯置
Mason avatar
By Mason
at 2017-09-09T05:08
圍棋的目標函數本來就不包括意外處理的部分,當然不會有意
Ula avatar
By Ula
at 2017-09-11T12:45
外處理的表現
Victoria avatar
By Victoria
at 2017-09-13T05:27
AlphaGo表現好確實不能表示100%轉為自動駕駛的目標函數後
Damian avatar
By Damian
at 2017-09-15T07:45
一定也可以訓練到同等級好,但反之在AlphaGo上出現的缺點
(事實上在圍棋來說甚至不算缺點)也同樣並不會保證在改變
Damian avatar
By Damian
at 2017-09-18T23:35
為自動駕駛的目標函數後還會出現
Lily avatar
By Lily
at 2017-09-21T11:55
自動駕駛比圍棋....
Selena avatar
By Selena
at 2017-09-23T16:45
圍棋能開圖,自動駕駛能嗎?
Andy avatar
By Andy
at 2017-09-28T04:56
deepmind目前想走的是醫療和星海爭霸哦
Elvira avatar
By Elvira
at 2017-10-02T13:48
Starcraft 2那個也只是過程而已,跟圍棋一樣是驗證學習能
力以及宣傳居多
Kama avatar
By Kama
at 2017-10-03T07:40
沒錯阿 AG的確有這個缺陷 所以人工智慧還可以進步很多
Charlotte avatar
By Charlotte
at 2017-10-05T03:55
噓 勝負分類問題 跟 輸贏目數回歸問題 完全不一樣 懂?
George avatar
By George
at 2017-10-06T17:31
SC2 之所以值得試是因為不完全公開資訊遊戲在電腦看起來難
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2017-10-10T18:30
度很高 我們覺得SC2比圍棋簡單是我們的「設計」理念跟電腦
不同...
George avatar
By George
at 2017-10-13T09:57
輸得少但絕對不會贏的步為啥要去下,就事論事
Caitlin avatar
By Caitlin
at 2017-10-14T01:06
輸了就直接認輸了吧,盤面差很多還繼續下??

李世石:請向柯潔說句“辛苦了”他應得到

Anthony avatar
By Anthony
at 2017-05-28T09:30
李世石:請向柯潔說句“辛苦了” 他應得到掌聲 https://goo.gl/LysKQ5 都經歷過這樣的痛苦,才能明白失敗的難受。 在柯潔舉起棋子認負後,韓國的《聯合新聞社》發表了名為《李世石:柯潔顯示他學到 了東西 應該得到掌聲》一文,對柯潔的苦鬥表示了理解和贊許。 文章中說—— 李世石九段希望向輸 ...

精華區裡的「電腦圍棋」討論串

Catherine avatar
By Catherine
at 2017-05-28T09:28
剛剛想去精華區找找看一些東西 突然看到了「電腦圍棋」這個討論串 才過了12年啊,這個討論串的臉已經腫到不能再腫了啊QQ - ...

人機大戰觀後雜感

Elizabeth avatar
By Elizabeth
at 2017-05-28T01:26
※ 引述《hdjj (hdjj)》之銘言: : 然而,這也是我所看到的,AI最大的問題點。 : 古力和AI聯手對局的時候,當局勢明顯不利,AI選擇了投子,古力選擇了續 : 戰。之後的落子,我們看到了AI幾乎是無厘頭的著手,導致局面進一步的不可 : 挽回。 最簡單的概念 開局設定讓先 50手時設貼5目 100 ...

打遍天下已無敵手 研發團隊宣布AlphaGo退

Iris avatar
By Iris
at 2017-05-28T00:08
AlphaGO 雖已退役了 但下次一定可以再看到DeepMind 但應該會在星海爭霸看到了 Deepmind 有一段星海爭霸的測試 https://www.youtube.com/watch?v=5iZlrBqDYPM https://www.youtube.com/watch?v=T90YHDI6 ...

人機大戰觀後雜感

Yedda avatar
By Yedda
at 2017-05-27T23:10
我還記得,當初棋力初段左右,和六段實力的朋友對局的感覺。 當我全局穩健進行,那他總是比我輕快,搶佔大場佔盡優勢,然後我自然落敗。 若我奮力挑起戰鬥,正面一博,可是局面混亂一個計算不清,往往大龍被屠。 當我想的太多太過急躁,露出明顯缺陷,他只是輕輕往我的弱點一擊,全局立刻 崩潰無法收拾。 回顧柯潔和AG ...