這兩盤棋沒人會比李世石做得好 - 圍棋

By Lucy
at 2016-03-12T09:35

Table of Contents

※ 引述《nnlisalive (nnlisalive)》之銘言：
: 我覺得要從程式碼方面下手了
: 首先就是阿發狗所謂的"勝率"是怎計算出來的?
: 不外乎用盤面上所得到的資訊轉換成數據
: 再代入勝率函數得到每一點的勝率
: 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點?
: 算出來的勝率沒有誤差? 如果有個點勝率是70%
: 具體來說應該是下了這個點跑到結束N次有0.7*N次會贏
: 但明明就還沒下完也不知道對方會怎下
: 所以只要能騙過電腦讓他一直下到誤判勝率的棋
: 阿發狗就會輸到怎死的都不知道了
: 問題是要怎騙過阿法狗?
: 我不知道 !

AlphaGO "勝率"計算大約是

最原始概念
假設現在盤面上AlphaGO有ABCDE五個地方值得下
就對ABCDE這個五位置後續各往後快速隨機亂下1000盤
一直下到官子結束看最後贏幾盤
假設結果
A位置贏830盤輸170盤
B位置贏750盤輸250盤
C位置贏640盤輸360盤
D位置贏912盤輸 88盤
E位置贏120盤輸880盤

電腦不會管平均贏了幾目只看輸贏最後就會選位置D
==================================

當然圍棋"隨機亂下"一千盤參價值可能有限
接下來做的就是讓
"隨機亂下1000盤"變成"快速下出1000盤有參考價值的棋"
MCTS圍棋的棋力就建構在
"隨機亂下"階段有意義的落子選擇還有快速下完那1000盤的棋局質量

--

All Comments

By Jessica
at 2016-03-15T11:51

原來如此要有價值就是慢而且夠多盤的機率越準

By Andy
at 2016-03-18T00:38

這樣看來電腦還是在用窮舉法逼近圍棋之神

By Elizabeth
at 2016-03-19T22:06

只是這次的窮舉法比較聰明加進了機率與統計

By Elvira
at 2016-03-23T03:18

圍棋就是變化複雜的特性正好讓用機率來計算落子的

By Todd Johnson
at 2016-03-26T01:56

AlphaGo變得超級強

By Christine
at 2016-03-30T22:01

這種"窮舉"已經很像人了是一種經驗累積只是比較無腦的經

By Joe
at 2016-04-02T06:59

這篇錯的 value network is used to reduce

By Susan
at 2016-04-03T09:33

the depth of the search tree

By Emily
at 2016-04-04T12:51

AlphaGo透過輸入的棋譜跟自我對戰學習兩件事

By Elma
at 2016-04-05T16:57

1.哪裡可能值得下 2.形勢判斷

By Genevieve
at 2016-04-08T23:20

簡略化的概念的確如本篇所說
AG強的地方在於，他有能力能判斷「哪些位置需要去測勝率

By Tracy
at 2016-04-13T15:58

他沒有把棋下到end game 而是用形勢判斷

By John
at 2016-04-15T09:26

」這件事，因此需要消耗大量資源與時間的全盤式隨機落子

By George
at 2016-04-18T11:20

以及算完所有分支樹的狀況在AG的考量下不會發生。

By Necoo
at 2016-04-20T11:51

To clark78118: The second rollout phase of each
simulation begins at leaf node sL and continues
until the end of the game. 他有算完啦XD

By Lauren
at 2016-04-22T13:02

只是它不只快速算完，也用了你說的形勢判斷

By Joe
at 2016-04-26T16:23

我之前po文的時候自己也沒看懂...剛才才去改@@

By Megan
at 2016-04-27T07:40

原po說這是原始概念也對，paper分析說這部分影響最大

By Regina
at 2016-04-29T15:39

我覺得深度學習帶來的新能力是: 可以在極短時間不計算而
做出業餘初段等級的直覺判斷。想像如果人類可以用0.01秒

By Elma
at 2016-05-03T04:55

做到業餘初段等級的判斷，那加上計算就不得了了。

By Yuri
at 2016-05-04T12:36

有講到是三段等級的

By Franklin
at 2016-05-06T11:16

https://www.zhihu.com/people/tian-yuan-dong

By Anthony
at 2016-05-11T08:56

連結，搜 Table 7，剛好看到跑勝率圖

By Queena
at 2016-05-14T14:14

感謝，我說業餘初段完全是個隨意估計，抱歉@@

By Brianna
at 2016-05-15T10:13

不過我覺得DarkForest在這點還是很難超出職業棋評?

By Edward Lewis
at 2016-05-18T16:55

剛對了一下第二盤步數，6446開時，講評也是眾說紛紜

Related Posts

關於ALPHAGO與李世石用時

By Andrew
at 2016-03-12T09:07

李世石當初選擇各兩小時，應該算是相對寬鬆的選擇，沒想到卻必須比ALPHAGO先逼入讀秒，應該是始料未及，而就現在ALPHAGO展現的水準來看，這個用時的選擇，對 ALPHAGO相當不錯。推估接下來會發生: 柯潔對上 ALPHAGO ! 柯潔：我選擇20秒3次。井山裕太對上 ALPHAGO ...

這兩盤棋沒人會比李世石做得好

By Damian
at 2016-03-12T09:07

看了這麼多討論﹐我覺得這篇文章的說法還是有一個誤區。即所謂的人類眼中的臭棋其實是勝率高的穩健下法這一立論根本。這一立論的根本在後續討論用到時混淆了勝率高和真的能獲勝的概念。換言之﹐AI選擇的勝率高實際是它認為這樣能獲勝。但這真的能獲勝嗎﹖ 且不論勝率是怎麼來的﹐既然是勝率就說明還是有導致失敗的可能。 ...

級位棋友看人機圍棋大戰

By Candice
at 2016-03-12T08:46

※ 引述《mathbug (天堂的定義)》之銘言： : 有一個問題能夠請高手回答嗎？ : 今天的人機大賽李世石說他的開局並不好 (怎麼說呢？) : 下到第10手如下圖 : http://lgs.tw/qx6hi8t : 右上角產生了一個小目 - 一間高掛 - 二間高夾 - 白棋選擇33內托的走法 : 下 ...

中國央視紀錄片《圍棋》共五集

By Ida
at 2016-03-12T08:27

https://www.youtube.com/playlist?list=PLK4OOtvzXDir311ZaOkGPao-PZk2auFcp 問師 https://youtu.be/uH6eAfTQ5gE 機變 https://youtu.be/KGVv2ILFjRA 啟迪 https://you ...

李世石 Go! Go! Go!

By Ivy
at 2016-03-12T03:00

※ 引述《bbbtri (cycling)》之銘言： : 本來想問這裡沒有人有可以出來解釋一下這篇(講AlphaGo用的演算法) : http://benkampha.us/posts/2016-03-11.html : (不過不知道為什麼, 連結好像失效了?) : 只大概看了一下, 因為連什麼是hand c ...