這兩盤棋 沒人會比李世石做得好 - 圍棋

Christine avatar
By Christine
at 2016-03-11T21:12

Table of Contents

※ 引述《nnlisalive (nnlisalive)》之銘言:
: ※ 引述《raiderho (冷顏冷雨)》之銘言:
: : 依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了:
: : 其一,在電腦判定的獲勝機率已經非常高時,
: : 不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已,
: : 而算法設計可能會讓非最佳解更容易被隨機挑到。
: : 這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。
: : 然而,若以上敘述為真,當電腦下出明顯臭棋時,電腦應該已經大幅佔優了。
: : 相反的,情勢還在膠著時,下錯會讓獲勝機率大幅降低,
: : 臭棋被挑中的機率近乎為零,這時,我們會看到非常緊繃的對局。
: : 這一點呼應「遇強則強,遇弱則弱」。
: : (最後一句不是指李和樊的差距,因為電腦棋力這幾個月增加不少);
: 我覺得要從程式碼方面下手了
: 首先就是阿發狗所謂的"勝率"是怎計算出來的?
: 不外乎用盤面上所得到的資訊轉換成數據
: 再代入勝率函數得到每一點的勝率
: 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點?
: 算出來的勝率沒有誤差? 如果有個點勝率是70%
: 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏
: 但明明就還沒下完 也不知道對方會怎下
: 所以只要能騙過電腦 讓他一直下到誤判勝率的棋
: 阿發狗就會輸到怎死的都不知道了
: 問題是要怎騙過阿法狗?
: 我 不 知 道 !

以前的圍棋程式所用的蒙地卡羅演算法
它的原理簡單的說
就是在目前的棋盤上,下了某一子之後
隨機開始落子,直到最後一子結束
最後判斷是黑勝還是白勝
之後重複N次的隨機落子,然後看這N次裡面,黑勝幾次,白勝幾次
這樣就可以判斷下這一子的勝率為何

當然我們知道,黑白相互交錯隨機落子,變化總共有361!=10^768
就算是雙方各下100步之後的情勢,也還有161!=10^286
基本上都是超級天文數字,電腦不可能做全部的隨機事件
所以電腦基本上只能做到有限的N次隨機次數
基本上圍棋盤面的真正變化次數跟電腦運算可隨機的次數差距越小
獲得的機率數值就越可能接近正確值
https://youtu.be/KMkjtZtGBsE
(網路有用蒙地卡羅法求π,看完大概就可以了解以上這段)

所以以前的圍棋程式
在初期布局的時候常會下出讓人類覺得很可笑的布局
越到後面變化越少時,則正確率越高

AlphaGO當然是超級進化版
它利用了類神經網路的學習,參考了人類棋譜
並自己跟自己對下累積了數千萬盤棋
練出了所謂的"直覺",可以把一些荒謬的落子排除掉
(例如第一手八七這種荒謬的棋步)
大幅度減少了隨機事件,使得演算法推估勝率能更為準確

真正理論上的「圍棋上帝」是使用窮舉法的暴力演算
其運算變化是個天文數字,依照目前的電腦是辦不到的
所以AlphaGo絕對不是「圍棋上帝」
不過也不要因此小看了AlphaGo

簡單的問題讓大家想想吧
A=(10^768- 10^265)/(10^768)
A這個數字我們都知道不是100%,但它跟100%有什麼不一樣?

--
Tags: 圍棋

All Comments

Cara avatar
By Cara
at 2016-03-14T22:59
其實這後面的技術並不困難, 接下來幾年不是不可能出現
超車的...(會有多少人做這個畢業呢?)
Tom avatar
By Tom
at 2016-03-15T23:01
技術多困難不談,消化數據沒個像樣的硬體會等死人
Bennie avatar
By Bennie
at 2016-03-17T01:06
已經很多大公司在投資啦, 其實人事成本比硬體貴呢
Quanna avatar
By Quanna
at 2016-03-20T02:47
1. 你略過了最重要的搜尋步驟(tree search); 2. 模擬
棋局並非隨機落子,若無圍棋知識輔助,局勢評估必定不
準確
Harry avatar
By Harry
at 2016-03-22T14:09
標準的 MCTS 是隨機落子沒錯, 但是這樣同樣很沒有效率
在這裡引進神經網路評估函數很高明, 太瞎的棋直接先跳過
Tracy avatar
By Tracy
at 2016-03-26T19:19
可是「直覺」有沒有可能排除掉真正的好棋?
Vanessa avatar
By Vanessa
at 2016-03-29T22:30
所以幾個網路的訓練很重要, 從這裡也不難理解
為什麼在領先的狀況特別容易下出臭棋(OS: 還是贏你管我)
Elma avatar
By Elma
at 2016-03-31T20:57
我把直覺假設成人類的棋感,那電腦會犯和人類一樣的錯嗎?
Charlie avatar
By Charlie
at 2016-04-04T03:41
這裡的"直覺"只影響評估順序而已, 時間內有算到就不會漏
Delia avatar
By Delia
at 2016-04-07T01:17
單純用蒙地卡羅法的話 之前的軟體就這樣 只能到業餘4 5段
Hedy avatar
By Hedy
at 2016-04-10T23:18
原po描述的只是「蒙地卡羅法」,只是MC,不是MCTS
Caitlin avatar
By Caitlin
at 2016-04-14T11:47
這跟AG用什麼方法無關,因為你說的是「以前的程式」
Daph Bay avatar
By Daph Bay
at 2016-04-16T11:47
其實後面的原理跟電腦棋類剛開始的時候一樣沒有變過
Emma avatar
By Emma
at 2016-04-21T11:05
當然還是要建決策樹, MCTS 只是維護這棵樹的方法而已
Agatha avatar
By Agatha
at 2016-04-24T12:25
在這之前只有 alpha-beta pruning, 這用在圍棋上不能看
Christine avatar
By Christine
at 2016-04-26T10:31
在這之前電腦西洋棋/象棋也已經開始用 heuristic search
Tracy avatar
By Tracy
at 2016-04-28T20:20
來減少計算量, 所以現在連手機上棋力都可以強到不行
Joseph avatar
By Joseph
at 2016-04-30T02:59
以後alphago的後代裝進手機也不是什麼問題
William avatar
By William
at 2016-05-03T14:15
圍棋的空間太大 想縮到這種程度恐怕有點困難 XD
Elizabeth avatar
By Elizabeth
at 2016-05-07T16:47
到時候可能要禁止圍棋選手外出上廁所和散步了
Ivy avatar
By Ivy
at 2016-05-10T14:06
手機可以雲端啊
Agatha avatar
By Agatha
at 2016-05-11T14:13
雲端運算應該可以辦得到?
Ursula avatar
By Ursula
at 2016-05-11T17:07
不要小看電腦硬體進步速度,你手中的iphone 6就比打敗
Christine avatar
By Christine
at 2016-05-15T07:42
當年西洋棋王的深藍電腦還快了

谷歌專家:不排除出現天網的可能性

Emily avatar
By Emily
at 2016-03-11T21:08
※ [本文轉錄自 movie 看板 #1MuiDInx ] 作者: zkow (逍遙山水憶秋年) 看板: movie 標題: [新聞] 谷歌專家:不排除出現天網的可能性 時間: Fri Mar 11 21:08:31 2016 谷歌人工智慧專家:不排除出現天網的可能性 北京新浪網 (2016-03-11 ...

李世石能否戰勝單機板AlphaGO?

Cara avatar
By Cara
at 2016-03-11T20:59
※ 引述《owke (owke)》之銘言: : Hi,各位棋友好, : 筆者自昨日變十分沮喪至今,沒想到浸淫多年的一門得意藝術, : 終究還是敵不過沒有美感的機器. : 筆者雖然棋藝不比高人,但也不差,但在形勢判斷仍然十分不足, : 不知前些日子在實況文下面評論局勢的棋友,棋力大多如何,好讓筆者比較比較自身的 ...

AlphaGO 擬人

Christine avatar
By Christine
at 2016-03-11T20:41
※ [本文轉錄自 C_Chat 看板 #1MuhG5_8 ] 作者: forb9823018 (風過無痕) 看板: C_Chat 標題: Re: [閒聊] AlphaGO 擬人 時間: Fri Mar 11 20:03:13 2016 ※ 引述《tsubasawolfy (悠久の翼)》之銘言: : ※ 引 ...

李世石能否戰勝單機板AlphaGO?

Vanessa avatar
By Vanessa
at 2016-03-11T20:29
Hi,各位棋友好, 筆者自昨日變十分沮喪至今,沒想到浸淫多年的一門得意藝術, 終究還是敵不過沒有美感的機器. 筆者雖然棋藝不比高人,但也不差,但在形勢判斷仍然十分不足, 不知前些日子在實況文下面評論局勢的棋友,棋力大多如何,好讓筆者比較比較自身的不足, 和各位高人有多大的差距, 回到正題,aja說 ...

AlphaGO掀起圍棋界的大波瀾

Sarah avatar
By Sarah
at 2016-03-11T20:28
其實ag是可以復盤的啊 至少可以得知取樣跟推演 我個人的看法是 如果電腦演算法超過了人類的水準 要得知某一解是否有較佳解最好的方法是給予更多資源去運算 增加搜尋深度廣度 事實上以現在的例子而言 我們可以回去看人類認知的可能較佳解是否曾出現在選項 如果有是因為那些分枝被捨棄 就可以一窺ag的思路 ※ 引述 ...