淺談AlphaGo - 圍棋

Quintina avatar
By Quintina
at 2017-01-05T11:46

Table of Contents

※ 引述《nnlisalive (nnlisalive)》之銘言:
: ※ 引述《ykes60513 (いちご)》之銘言:
: : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 請問有誰知道90%或85%是怎計算出來的?
: 因為對手還沒下 需要跑迴圈運算
: 這勝率統計是否有所謂的信賴區間
: 再來是會不會有100%勝率落子的時候
: 當100%的路一出現 是否就代表比賽結束
: 去年AG對上李 我看那個落子機率會忽高忽低
: 雖然大部分的時候是50~100%遞增
: 但李 v.s AG大戰第4局的78手 頓時讓AG勝率下降不少
: 是否代表只要我們能下出Alpha世界線以外的棋
: 就能迎接勝利的美好未來?

小弟這學期有修電腦對局理論的相關課程

看到這篇想說分享一下好了

我們上一次的作業是要做黑白棋的 AI

使用的方法就是蒙地卡羅搜尋樹 (跟 AlphaGo 比起來只是菜而已)

考慮當前我可以下的每一步棋的情況下

我們都可以假設「雙方棋手只會亂數下棋」

並且去計算每一步可行的棋所亂數出來的盤面勝率有多少

這裡的勝率是指最終盤面 可以想像電腦亂數把一盤棋下完只要幾毫秒的時間

我自己做出來的實驗一秒內算個一萬多盤棋是沒有問題的

概念上其實就是隨機抽樣而已

關於使用到的技術 其實還有各式各樣的優化

並且讓電腦接續前一步下的棋思考也並非難事 (實作上不難)

因此電腦暖機越久想得越清楚 越接近實際上的亂數勝率(非真實勝率)

-- 以上是我的作業 XD --

回到 alphago

我想 alphago 應該在裡面也用了不少亂數

配合上深度學習的神經網路可以幫他為某些可行點做加權

他可以走向期望上更好的盤面 並且以學過的棋譜去估計勝率

這裡的勝率無法達到 100% 我猜一部分原因是

在亂數情況下電腦會嘗試去填自己的空,使得自己反而輸棋,因此會產生一些敗局

不過因為我沒有讀過 alphago 的論文 所以不是很確定詳細情況

也許就連 deepmind 的研究員都沒辦法給出 100% 的答案?

就我剛剛提到我的作業來說,

我也有不斷追蹤自己 AI 每一步棋的期望勝率

不過因為是純亂數 所以沒有很準 XD (但至少我到現在沒下贏自己的 AI 就是..)

我也沒有辦法很準確說明為什麼我的 AI 有時候會爛掉 XDDD (可能是 bug 吧)

以上分享 歡迎留言討論!

--
Tags: 圍棋

All Comments

Kumar avatar
By Kumar
at 2017-01-10T07:17
暖機是什麼?
Adele avatar
By Adele
at 2017-01-11T16:28
因為電腦思路是樹狀的 他可以保留對手走的路徑 其他
Dinah avatar
By Dinah
at 2017-01-14T07:18
砍掉 抱歉沒有講得很清楚
大致上就是他可以利用前面幾手耗時所想的東西繼續想
Elma avatar
By Elma
at 2017-01-15T14:58
半桶水的大學作業就別說在這邊說嘴了 真的懂再來說
Donna avatar
By Donna
at 2017-01-16T12:32
他是在說他對mcts的理解,也是回應上一篇的疑問。其他人覺
得想補充的也歡迎啊
Jessica avatar
By Jessica
at 2017-01-17T07:13
這種還不能說?不懂裝逼的廢文多到膩
Dinah avatar
By Dinah
at 2017-01-21T10:34
大致上講得沒錯啊,不知道476上站1發文的politics大大有何
更詳細的見解
Freda avatar
By Freda
at 2017-01-21T12:08
https://goo.gl/U5ypHp 英文看不懂的話看強國人講大綱
https://www.zhihu.com/question/41176911
Jacob avatar
By Jacob
at 2017-01-25T04:16
這篇自己都說沒看過deepmind的論文了 屁這些有價值嗎?
mcts這只是個名詞 我用ooxx遊戲都可以跟你說明
但deeplearn不是單純的mcts 就降
Jacob avatar
By Jacob
at 2017-01-28T08:45
哈哈我有空會拜讀一波!
Caitlin avatar
By Caitlin
at 2017-02-01T17:48
不是純粹的MCTS沒錯,但會無法直接算出100%勝率的理由確實
是因為這一塊,他講的還是有打在點上啊,或者您想要補充更
詳細的其他方面理由?
Caroline avatar
By Caroline
at 2017-02-06T11:51
就跟選情統計一樣,抽樣越大就越接近真實的結果
Susan avatar
By Susan
at 2017-02-10T00:16
deep learning 就只是用來剪枝 & 選擇要先試哪一手
Aaliyah avatar
By Aaliyah
at 2017-02-14T15:51
這概念也是可以用在其他遊戲上啊
Andy avatar
By Andy
at 2017-02-18T03:17
厲害 能往圍棋發展嗎

淺談AlphaGo

Candice avatar
By Candice
at 2017-01-05T11:19
※ 引述《ykes60513 (いちご)》之銘言: : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者 請問有誰知道90%或85%是怎計算出來的? 因為對手還沒下 需要跑迴圈運算 這勝率統計是否有所謂的信賴區間 再來是會不會有100%勝率落子的時候 當100%的路一出現 是否 ...

從Alphago黃博士看圍棋界的變革與未來

Rachel avatar
By Rachel
at 2017-01-05T11:01
最近幾天火紅的新聞,網路圍棋出現一個叫做Master的帳號,60連勝中日韓台世界冠軍 的頂尖高手,昨日在對局中,親自回應公開自己的身分就是Alphago的黃博士,其實從前面 幾次難得打字出現繁體字的回應,不難猜到就是黃先生,因為就棋界來說,會使用繁體中 文的國家只有台灣。從Alphago這次造成的旋風, ...

Master現身 黃士傑:成果令人激動

Suhail Hany avatar
By Suhail Hany
at 2017-01-05T10:44
https://goo.gl/8RoKns Master現身 黃士傑:成果令人激動 中央社 – 2017年1月5日 上午9:15 (中央社台北5日電)出身台灣的AlphaGo幕後推手黃士傑表示,最新版AlphaGo在對局中 富啟發性的創新,從中可學到的及對局結果「都令我們非常激動」。 近日在圍棋界掀起 ...

把佐為放到現在能世界排名第幾?

Dora avatar
By Dora
at 2017-01-05T10:37
如題 他能打敗柯潔嗎? 說不定使用上古老的定石會產生奇效 大家覺得呢?? - ...

淺談AlphaGo

Gary avatar
By Gary
at 2017-01-05T10:04
這幾天 AI又帶給了大家新的衝擊 AlphaGo又再次進化了 而且遠超乎大家的想像 顯然之後AI會更加深入這塊圈子 影響只會越來越廣 不得不深思要怎麼看待這場新的革命 雖然有些人說AI能使圍棋的發展更進一步 但坦白說我是有些悲觀的 因為從本質上AlphaGo就跟人類差太多了 首先 AlphaGo ...