阿爾法會修正第四盤錯誤明天不再犯嗎? - 圍棋

Elma avatar
By Elma
at 2016-03-14T16:31

Table of Contents


其實有個很大的問號,雖然阿爾法對外的更新已經中止

但他自己有學習功能

上一場輸給李世石那盤,為了避免劫爭而導致崩盤的情形

不知在第五盤時是否會自動修正這個失誤?

面對類似選擇時,會下別的位置,或勇於打劫呢?

因為有前盤"經驗",使他不再重蹈覆轍?

不知電腦自動學習功能是如何,會改變他的棋風跟戰略嗎?

--
Tags: 圍棋

All Comments

Frederica avatar
By Frederica
at 2016-03-16T00:08
直接寫信去問deepmind阿
Kumar avatar
By Kumar
at 2016-03-20T18:57
谷歌是說這幾場比賽期間他們都沒有調整過電腦,只有收
集數據而已,所以只有依賴自我學習。但又有人說電腦比
賽完就停機不動了,自然就沒啟動自我學習,所以好像有
兩種說法。
Ina avatar
By Ina
at 2016-03-23T20:34
這幾天沒有自我學習,第五天的版本就是第一天的版本
Joseph avatar
By Joseph
at 2016-03-25T08:13
DCNN的學習模式在比賽前就停止學習了
Daph Bay avatar
By Daph Bay
at 2016-03-30T04:46
只要不啟動權重調整程序就不會學習啦 下幾盤都一樣
Isla avatar
By Isla
at 2016-04-03T06:40
其實這樣也不太公平 正常來說要啟動學習功能
不然高手戰個幾盤看出破綻就屌打了
Enid avatar
By Enid
at 2016-04-04T10:17
只是阿法狗前面太猛了所以沒人說話
Harry avatar
By Harry
at 2016-04-06T08:52
有沒有調整只有谷哥自己才知道了 這是一場商業秀
Dorothy avatar
By Dorothy
at 2016-04-11T03:30
第五盤和第四盤是同版本,沒修bug
小李拿到賽後資料回饋時就知道了有沒有修版本了,韓棋院
Queena avatar
By Queena
at 2016-04-15T04:54
應該也會希望小李釋出他拿到的資料。
Megan avatar
By Megan
at 2016-04-19T09:16
自我學習也跟小李下的那幾盤沒關係 跟看破戰無關啦
Ida avatar
By Ida
at 2016-04-22T10:00
google就說了要針對李世石 一千盤李世時棋譜都遠遠不夠
Elizabeth avatar
By Elizabeth
at 2016-04-26T16:16
而若是靠左右互博五天就能贏 那根本不用AG 把AG內的RL拉出
Brianna avatar
By Brianna
at 2016-04-29T02:26
來就可以了 這東西多算搞不好產生bias棋力還會下降
Hardy avatar
By Hardy
at 2016-04-29T11:23
不然也修一下崩潰亂下啊
Jack avatar
By Jack
at 2016-05-03T14:12
如果直接加限制條件就是針對圍棋了 deepmind是想展現他們
Donna avatar
By Donna
at 2016-05-07T01:14
深度學習的強大和適用性 所以連局部死活都不算交給神經網
Leila avatar
By Leila
at 2016-05-10T07:10
不是只要贏而已 追求的是不同的美感 XD
Bethany avatar
By Bethany
at 2016-05-14T04:25
我記得昨天阿狗輸的時候跳出的視窗感覺是說已存檔..
Carol avatar
By Carol
at 2016-05-17T22:49
鎖版本了,應該不會微調
Regina avatar
By Regina
at 2016-05-20T03:43
訪問時就有講了啊,每一場比賽的版本都一樣
Edward Lewis avatar
By Edward Lewis
at 2016-05-24T23:41
其實這4盤在樣本數裡應該蠻小
Elizabeth avatar
By Elizabeth
at 2016-05-27T05:03
如果鎖版本,反而是小李這幾盤成長,阿法狗停止學習XDDD
果斷猜明天小李贏

圍棋AI AlphaGo 之我見

Rosalind avatar
By Rosalind
at 2016-03-14T16:18
1. 據說 AlphaGo用到的Neuro Network深達13層 有任何穩定性的報告或是說明嗎? 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 AlphaGo的設計應該是循著第一條路線 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 反敗為 ...

古力評柯潔是網紅 柯潔慶祝李世石首勝喝

Ethan avatar
By Ethan
at 2016-03-14T16:03
古力評柯潔是網紅 柯潔慶祝李世石首勝喝醉(圖) 北京時間3月14日,因為李世石和谷歌AlphaGo的人機大戰,圍棋運動再度受到公眾的關注 ,擔任解說嘉賓的柯潔、古力等人也都成為了“網紅”。在李世石贏棋之後,古力和柯潔 兩位世界冠軍都有“大動作”,古力註冊了微博,自稱為了關注柯潔,柯潔則直接喝醉了 。    ...

從象棋觀點看AlphaGO為什麼會輸

Iris avatar
By Iris
at 2016-03-14T15:55
原文恕刪... 本文只是要借用一下變化圖來講AlphaGO第四局為什麼會輸所以連標題都換了敬請見諒 相信大家都覺得很好奇... 為什麼AlphaGO前幾盤走的像神 昨天卻整個像是吃了瀉藥一樣整個烙賽? 坦白講...當昨天看到白78以後一段 我不但不意外 反而還覺得很熟悉、很感動...像是喚醒了塵封已久的 ...

Facebook工程師解疑:AlphaGo為什這厲害

Daph Bay avatar
By Daph Bay
at 2016-03-14T15:40
Facebook工程師解疑:AlphaGo為什麼這麼厲害?  Facebook田淵棟解析演算法技術:AlphaGo為什麼這麼厲害?   最近我仔細看了下AlphaGo在《自然》雜誌上發表的文章,寫一些分析給大家分享。   AlphaGo這個系統主要由幾個部分組成:   走棋網路(Policy Netw ...

「戰勝自己」對於AlphaGo而言不只是口號

Odelette avatar
By Odelette
at 2016-03-14T15:12
※ 引述《Tkuei (itand#39;s me)》之銘言: : 這是台大資工林守德老師在他FB寫的一篇文章,是他看過Nature那篇論文之後寫的感想 : 個人認為高手解讀應該有助於釐清大家對AlphaGo行為模式的理解 : 原文連結:https://goo.gl/m8cBHn (FB連結,不喜誤入) 小 ...