淺談AlphaGo - 圍棋
By Quintina
at 2017-01-05T11:46
at 2017-01-05T11:46
Table of Contents
※ 引述《nnlisalive (nnlisalive)》之銘言:
: ※ 引述《ykes60513 (いちご)》之銘言:
: : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 請問有誰知道90%或85%是怎計算出來的?
: 因為對手還沒下 需要跑迴圈運算
: 這勝率統計是否有所謂的信賴區間
: 再來是會不會有100%勝率落子的時候
: 當100%的路一出現 是否就代表比賽結束
: 去年AG對上李 我看那個落子機率會忽高忽低
: 雖然大部分的時候是50~100%遞增
: 但李 v.s AG大戰第4局的78手 頓時讓AG勝率下降不少
: 是否代表只要我們能下出Alpha世界線以外的棋
: 就能迎接勝利的美好未來?
小弟這學期有修電腦對局理論的相關課程
看到這篇想說分享一下好了
我們上一次的作業是要做黑白棋的 AI
使用的方法就是蒙地卡羅搜尋樹 (跟 AlphaGo 比起來只是菜而已)
考慮當前我可以下的每一步棋的情況下
我們都可以假設「雙方棋手只會亂數下棋」
並且去計算每一步可行的棋所亂數出來的盤面勝率有多少
這裡的勝率是指最終盤面 可以想像電腦亂數把一盤棋下完只要幾毫秒的時間
我自己做出來的實驗一秒內算個一萬多盤棋是沒有問題的
概念上其實就是隨機抽樣而已
關於使用到的技術 其實還有各式各樣的優化
並且讓電腦接續前一步下的棋思考也並非難事 (實作上不難)
因此電腦暖機越久想得越清楚 越接近實際上的亂數勝率(非真實勝率)
-- 以上是我的作業 XD --
回到 alphago
我想 alphago 應該在裡面也用了不少亂數
配合上深度學習的神經網路可以幫他為某些可行點做加權
他可以走向期望上更好的盤面 並且以學過的棋譜去估計勝率
這裡的勝率無法達到 100% 我猜一部分原因是
在亂數情況下電腦會嘗試去填自己的空,使得自己反而輸棋,因此會產生一些敗局
不過因為我沒有讀過 alphago 的論文 所以不是很確定詳細情況
也許就連 deepmind 的研究員都沒辦法給出 100% 的答案?
就我剛剛提到我的作業來說,
我也有不斷追蹤自己 AI 每一步棋的期望勝率
不過因為是純亂數 所以沒有很準 XD (但至少我到現在沒下贏自己的 AI 就是..)
我也沒有辦法很準確說明為什麼我的 AI 有時候會爛掉 XDDD (可能是 bug 吧)
以上分享 歡迎留言討論!
--
: ※ 引述《ykes60513 (いちご)》之銘言:
: : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 請問有誰知道90%或85%是怎計算出來的?
: 因為對手還沒下 需要跑迴圈運算
: 這勝率統計是否有所謂的信賴區間
: 再來是會不會有100%勝率落子的時候
: 當100%的路一出現 是否就代表比賽結束
: 去年AG對上李 我看那個落子機率會忽高忽低
: 雖然大部分的時候是50~100%遞增
: 但李 v.s AG大戰第4局的78手 頓時讓AG勝率下降不少
: 是否代表只要我們能下出Alpha世界線以外的棋
: 就能迎接勝利的美好未來?
小弟這學期有修電腦對局理論的相關課程
看到這篇想說分享一下好了
我們上一次的作業是要做黑白棋的 AI
使用的方法就是蒙地卡羅搜尋樹 (跟 AlphaGo 比起來只是菜而已)
考慮當前我可以下的每一步棋的情況下
我們都可以假設「雙方棋手只會亂數下棋」
並且去計算每一步可行的棋所亂數出來的盤面勝率有多少
這裡的勝率是指最終盤面 可以想像電腦亂數把一盤棋下完只要幾毫秒的時間
我自己做出來的實驗一秒內算個一萬多盤棋是沒有問題的
概念上其實就是隨機抽樣而已
關於使用到的技術 其實還有各式各樣的優化
並且讓電腦接續前一步下的棋思考也並非難事 (實作上不難)
因此電腦暖機越久想得越清楚 越接近實際上的亂數勝率(非真實勝率)
-- 以上是我的作業 XD --
回到 alphago
我想 alphago 應該在裡面也用了不少亂數
配合上深度學習的神經網路可以幫他為某些可行點做加權
他可以走向期望上更好的盤面 並且以學過的棋譜去估計勝率
這裡的勝率無法達到 100% 我猜一部分原因是
在亂數情況下電腦會嘗試去填自己的空,使得自己反而輸棋,因此會產生一些敗局
不過因為我沒有讀過 alphago 的論文 所以不是很確定詳細情況
也許就連 deepmind 的研究員都沒辦法給出 100% 的答案?
就我剛剛提到我的作業來說,
我也有不斷追蹤自己 AI 每一步棋的期望勝率
不過因為是純亂數 所以沒有很準 XD (但至少我到現在沒下贏自己的 AI 就是..)
我也沒有辦法很準確說明為什麼我的 AI 有時候會爛掉 XDDD (可能是 bug 吧)
以上分享 歡迎留言討論!
--
Tags:
圍棋
All Comments
By Kumar
at 2017-01-10T07:17
at 2017-01-10T07:17
By Adele
at 2017-01-11T16:28
at 2017-01-11T16:28
By Dinah
at 2017-01-14T07:18
at 2017-01-14T07:18
By Elma
at 2017-01-15T14:58
at 2017-01-15T14:58
By Donna
at 2017-01-16T12:32
at 2017-01-16T12:32
By Jessica
at 2017-01-17T07:13
at 2017-01-17T07:13
By Dinah
at 2017-01-21T10:34
at 2017-01-21T10:34
By Freda
at 2017-01-21T12:08
at 2017-01-21T12:08
By Jacob
at 2017-01-25T04:16
at 2017-01-25T04:16
By Jacob
at 2017-01-28T08:45
at 2017-01-28T08:45
By Caitlin
at 2017-02-01T17:48
at 2017-02-01T17:48
By Caroline
at 2017-02-06T11:51
at 2017-02-06T11:51
By Susan
at 2017-02-10T00:16
at 2017-02-10T00:16
By Aaliyah
at 2017-02-14T15:51
at 2017-02-14T15:51
By Andy
at 2017-02-18T03:17
at 2017-02-18T03:17
Related Posts
淺談AlphaGo
By Candice
at 2017-01-05T11:19
at 2017-01-05T11:19
從Alphago黃博士看圍棋界的變革與未來
By Rachel
at 2017-01-05T11:01
at 2017-01-05T11:01
Master現身 黃士傑:成果令人激動
By Suhail Hany
at 2017-01-05T10:44
at 2017-01-05T10:44
把佐為放到現在能世界排名第幾?
By Dora
at 2017-01-05T10:37
at 2017-01-05T10:37
淺談AlphaGo
By Gary
at 2017-01-05T10:04
at 2017-01-05T10:04