AlphoGo什麼時候在長考? - 圍棋

Table of Contents

※ 引述《mathbug (天堂的定義)》之銘言:
: 我覺得這是一個很有趣的問題
: AlphaGo 什麼時候長考? 就是什麼時候要花很多時間計算?
: 理論上,當人類對手在思考下一手的時間
: AlphaGo 也可以用自己的邏輯(value function)〝幫〞對方選出最佳的幾個點
: 然後同時思考自己的對策
: 一旦人類對手的落點不在自己選出最佳的幾個點時,一切又要重新計算了
: 換言之,當AlphaGo長考的時候,表示人類對手的選點不同於自己的邏輯
: (非電腦判斷分數最高的幾個點)
: 也許好好在重播中 觀察AlphaGo的長考時間點 可以多瞭解它不同的邏輯

第一盤 AlphaGo 好幾手花很多時間在思考

導致AlphaGo用時也非常可觀(第二盤AlphaGo用時少很多了)

顯然李也給AlphaGo出了難題

甚至於行至中盤 右下角白棋沒做活之前 很多高手仍然認為黑棋佔優

第三盤的最佳策略應該如下:

1. 相同開局,AlphaGo 應該會相同應對 直到李世石自己認為的問題手

2. 真心認為人類要(好好看重播) 知道怎麼下才會讓AlphaGo重新花時間計算思考

唯有這樣 才能讓AlphaGo有前後策略不連貫的機會

3. 前半盤沒優勢(戰略階段) 後半盤應該沒機會(戰術階段 電腦計算大勝人類)

--

All Comments

Doris avatarDoris2016-03-12
如果下一模一樣的步法 AG會同樣策略嗎?
Ophelia avatarOphelia2016-03-16
相同開局未必相同應對,AG最少也會把第一局參入經驗
Rae avatarRae2016-03-21
第一局的經驗是必勝.
Yedda avatarYedda2016-03-23
應該不會相同策略. AG的演算法有加入亂數取點.
Kyle avatarKyle2016-03-26
一定有亂數取點 不然對電腦就會出現必勝法(BUG)
Yedda avatarYedda2016-03-31
按照類神經網路的邏輯,這兩場完參數應該又不同了
如果這幾天 AlphaGO 都仍舊不斷自我練習的話,兩天後
不會是一模一樣的應對....它還在不斷成長阿!
Lucy avatarLucy2016-04-05
那如果可以無限反悔 有辦法Try出一條贏AG的局嗎
Gilbert avatarGilbert2016-04-08
就窮舉法啊樓上
Joseph avatarJoseph2016-04-09
無限反悔的話,一盤棋要下幾天?
Megan avatarMegan2016-04-12
下小棋盤來觀察AG的步法?
Sierra Rose avatarSierra Rose2016-04-14
小棋盤每個點跑出來的權重也會不一樣啊