這兩盤棋 沒人會比李世石做得好 - 圍棋

Lucy avatar
By Lucy
at 2016-03-12T09:35

Table of Contents

※ 引述《nnlisalive (nnlisalive)》之銘言:
: 我覺得要從程式碼方面下手了
: 首先就是阿發狗所謂的"勝率"是怎計算出來的?
: 不外乎用盤面上所得到的資訊轉換成數據
: 再代入勝率函數得到每一點的勝率
: 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點?
: 算出來的勝率沒有誤差? 如果有個點勝率是70%
: 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏
: 但明明就還沒下完 也不知道對方會怎下
: 所以只要能騙過電腦 讓他一直下到誤判勝率的棋
: 阿發狗就會輸到怎死的都不知道了
: 問題是要怎騙過阿法狗?
: 我 不 知 道 !


AlphaGO "勝率"計算大約是

最原始概念
假設現在盤面上AlphaGO有ABCDE五個地方值得下
就對ABCDE這個五位置後續各往後 快速隨機亂下1000盤
一直下到官子結束看最後贏幾盤
假設結果
A位置 贏830盤 輸170盤
B位置 贏750盤 輸250盤
C位置 贏640盤 輸360盤
D位置 贏912盤 輸 88盤
E位置 贏120盤 輸880盤

電腦不會管平均贏了幾目只看輸贏 最後就會選位置D
==================================

當然圍棋"隨機亂下"一千盤參價值可能有限
接下來做的就是讓
"隨機亂下1000盤"變成"快速下出1000盤有參考價值的棋"
MCTS圍棋的棋力就建構在
"隨機亂下"階段 有意義的落子選擇還有快速下完那1000盤的棋局質量


--
Tags: 圍棋

All Comments

Jessica avatar
By Jessica
at 2016-03-15T11:51
原來如此 要有價值就是慢 而且夠多盤的機率越準
Andy avatar
By Andy
at 2016-03-18T00:38
這樣看來電腦還是在用窮舉法逼近圍棋之神
Elizabeth avatar
By Elizabeth
at 2016-03-19T22:06
只是這次的窮舉法比較聰明 加進了機率與統計
Elvira avatar
By Elvira
at 2016-03-23T03:18
圍棋就是變化複雜的特性 正好讓用機率來計算落子的
Todd Johnson avatar
By Todd Johnson
at 2016-03-26T01:56
AlphaGo變得超級強
Christine avatar
By Christine
at 2016-03-30T22:01
這種"窮舉"已經很像人了 是一種經驗累積 只是比較無腦的經
Joe avatar
By Joe
at 2016-04-02T06:59
這篇錯的 value network is used to reduce
Susan avatar
By Susan
at 2016-04-03T09:33
the depth of the search tree
Emily avatar
By Emily
at 2016-04-04T12:51
AlphaGo透過輸入的棋譜跟自我對戰 學習兩件事
Elma avatar
By Elma
at 2016-04-05T16:57
1.哪裡可能值得下 2.形勢判斷
Genevieve avatar
By Genevieve
at 2016-04-08T23:20
簡略化的概念的確如本篇所說
AG強的地方在於,他有能力能判斷「哪些位置需要去測勝率
Tracy avatar
By Tracy
at 2016-04-13T15:58
他沒有把棋下到end game 而是用形勢判斷
John avatar
By John
at 2016-04-15T09:26
」這件事,因此需要消耗大量資源與時間的全盤式隨機落子
George avatar
By George
at 2016-04-18T11:20
以及算完所有分支樹的狀況在AG的考量下不會發生。
Necoo avatar
By Necoo
at 2016-04-20T11:51
To clark78118: The second rollout phase of each
simulation begins at leaf node sL and continues
until the end of the game. 他有算完啦XD
Lauren avatar
By Lauren
at 2016-04-22T13:02
只是它不只快速算完,也用了你說的形勢判斷
Joe avatar
By Joe
at 2016-04-26T16:23
我之前po文的時候自己也沒看懂...剛才才去改@@
Megan avatar
By Megan
at 2016-04-27T07:40
原po說這是原始概念也對,paper分析說這部分影響最大
Regina avatar
By Regina
at 2016-04-29T15:39
我覺得深度學習帶來的新能力是: 可以在極短時間不計算而
做出業餘初段等級的直覺判斷。想像如果人類可以用0.01秒
Elma avatar
By Elma
at 2016-05-03T04:55
做到業餘初段等級的判斷,那加上計算就不得了了。
Yuri avatar
By Yuri
at 2016-05-04T12:36
有講到是三段等級的
Franklin avatar
By Franklin
at 2016-05-06T11:16
https://www.zhihu.com/people/tian-yuan-dong
Anthony avatar
By Anthony
at 2016-05-11T08:56
連結,搜 Table 7,剛好看到跑勝率圖
Queena avatar
By Queena
at 2016-05-14T14:14
感謝,我說業餘初段完全是個隨意估計,抱歉@@
Brianna avatar
By Brianna
at 2016-05-15T10:13
不過我覺得DarkForest在這點還是很難超出職業棋評?
Edward Lewis avatar
By Edward Lewis
at 2016-05-18T16:55
剛對了一下第二盤步數,6446開時,講評也是眾說紛紜

關於ALPHAGO與李世石用時

Andrew avatar
By Andrew
at 2016-03-12T09:07
李世石當初選擇各兩小時,應該算是相對寬鬆的選擇,沒想到卻必須比ALPHAGO先逼入 讀秒,應該是始料未及,而就現在ALPHAGO展現的水準來看,這個用時的選擇,對 ALPHAGO相當不錯。 推估接下來會發生: 柯潔 對上 ALPHAGO ! 柯潔:我選擇20秒3次。 井山裕太 對上 ALPHAGO ...

這兩盤棋 沒人會比李世石做得好

Damian avatar
By Damian
at 2016-03-12T09:07
看了這麼多討論﹐我覺得這篇文章的說法還是有一個誤區。 即所謂的人類眼中的臭棋其實是勝率高的穩健下法這一立論根本。 這一立論的根本在後續討論用到時混淆了勝率高和真的能獲勝的概念。 換言之﹐AI選擇的勝率高實際是它認為這樣能獲勝。但這真的能獲勝嗎﹖ 且不論勝率是怎麼來的﹐既然是勝率就說明還是有導致失敗的可能。 ...

級位棋友看人機圍棋大戰

Candice avatar
By Candice
at 2016-03-12T08:46
※ 引述《mathbug (天堂的定義)》之銘言: : 有一個問題能夠請高手回答嗎? : 今天的人機大賽 李世石說他的開局並不好 (怎麼說呢?) : 下到第10手 如下圖 : http://lgs.tw/qx6hi8t : 右上角產生了一個 小目 - 一間高掛 - 二間高夾 - 白棋選擇33內托的走法 : 下 ...

中國央視紀錄片《圍棋》共五集

Ida avatar
By Ida
at 2016-03-12T08:27
https://www.youtube.com/playlist?list=PLK4OOtvzXDir311ZaOkGPao-PZk2auFcp 問師 https://youtu.be/uH6eAfTQ5gE 機變 https://youtu.be/KGVv2ILFjRA 啟迪 https://you ...

李世石 Go! Go! Go!

Ivy avatar
By Ivy
at 2016-03-12T03:00
※ 引述《bbbtri (cycling)》之銘言: : 本來想問這裡沒有人有可以出來解釋一下這篇(講AlphaGo用的演算法) : http://benkampha.us/posts/2016-03-11.html : (不過不知道為什麼, 連結好像失效了?) : 只大概看了一下, 因為連什麼是hand c ...