有關"深度學習"的文章 - 圍棋

Audriana avatar
By Audriana
at 2016-03-16T11:24

Table of Contents

※ 引述《OxfordGOD (牛津神)》之銘言:
: http://www.bnext.com.tw/article/view/id/38923
: 目前我在網路上看到這篇介紹的比較詳細

第一次粗略地看完這一篇文章 結合這幾天來的思考 我想提出一些看法

簡略地先說說 AlphaGo 的三大手法:(有錯請指正)

1. 策略網路 (根據大量棋譜訓練 監督式學習 提出(雙方)最有可能的落子點)

https://goo.gl/bONQ6T

2. 評價網路 (根據兩台能力相同的AlphaGo(隨機多次)下到完,
推估落子點勝率,選勝率高者。由於兩台機器能力一樣,
此機率跟落點有關,跟對手是誰或能力無關)

https://goo.gl/XWfWnv

3. 蒙地卡羅搜尋樹 (混合1與2並進行簡化動作,不需要每一點或每一個分支進行分析)

____________________________________________________________

也請參考 http://www.slideshare.net/ccckmit/alphago-59482042

(用十分鐘瞭解《AlphaGo的幾個可能弱點》)
____________________________________________________________
****** 以下為我的看法 *********
_______________________________

個人覺得有兩個方向可能可以試試 讓AlphaGo更接近完美

A. 訓練棋譜先分類 如我之前的文章所說明 #1MvdF35h
(避開勝負手/無理手翻盤的棋譜 訓練時只採用完勝的棋譜)

B. 將評價網路中的勝率最高著點改為圍地目數最多之著點

當然可以兩種都記錄下來

根據以上的第2點,比方說,模擬10000盤,某a點圍地最多,它的勝率也應該是

勝率最高的幾個點之一,這絕對是正相關的兩種參數
(若不是,系統的不穩定性就出來了(如第四盤的鬼手出現))

--
Tags: 圍棋

All Comments

Caitlin avatar
By Caitlin
at 2016-03-18T05:56
來人啊,把千萬盤棋譜表上圍地最大的著點
Franklin avatar
By Franklin
at 2016-03-19T09:15
等等,你到底是在說評價網路還是策略網路
Barb Cronin avatar
By Barb Cronin
at 2016-03-20T20:08
表->標
Caroline avatar
By Caroline
at 2016-03-21T02:38
原來的評價網路也是沒有勝率最高著點這種輸出
Yedda avatar
By Yedda
at 2016-03-25T14:45
有些棋是專門破空或殺棋的,這跟圍地就無關了吧
Zenobia avatar
By Zenobia
at 2016-03-29T15:48
不如說是相對目數增幅
Belly avatar
By Belly
at 2016-03-30T10:38
你可以自己定義你的評價網路,但不要說是alphaGo的可以嗎?

Alpha GO 韓國棋院受封名譽九段

Hedy avatar
By Hedy
at 2016-03-16T11:02
圖: http://goo.gl/U1vbSY 3月14日韓國棋院透露說:“正在和李世石展開世紀對決的Alpha GO,其實力毫不遜色于 韓國棋院排名第2的李世石九段,而且為韓國圍棋的發展做出了貢獻,所以決定授予 Alpha GO名譽職業九段證書。 - ...

李世石輸了,但這是場古典的勝利

Isabella avatar
By Isabella
at 2016-03-16T09:35
節錄自andlt;大紀元新聞網andgt; 原文連結:http://goo.gl/OW96kc 文/夏小強 2016年3月9日,韓國首爾,韓國棋手李世石與谷歌圍棋軟體AlphaGo展開5局圍棋比賽的第 一局。當李世石中盤認輸之後,很多人都認為這是李世石輕敵和發揮不好所致。但是,3 月10日,當第二局人機大 ...

GoRatings將AlphaGo評為世界第2

Adele avatar
By Adele
at 2016-03-16T09:20
※ 引述《bonuswhoring (flips for life)》之銘言: : 資料來源: http://www.goratings.org/ : Rank Name ♂♀ Flag Elo : 1 Ke Jie ♂ cn ...

AlphaGo竄升世界第2 劍指世界第1棋士

Christine avatar
By Christine
at 2016-03-16T09:00
http://www.cna.com.tw/news/firstnews/201603165006-1.aspx (中央社台北16日電)根據ELO最新世界圍棋排名,Google AlphaGo以4勝1負力壓韓國棋士李世石九段後,竄升世界第2,劍指目前暫居世界第1的中國大陸棋士柯潔九段。 柯潔多次向Alph ...

AlphaGo開放式複製計畫

Ina avatar
By Ina
at 2016-03-16T08:45
在GitHub上面有一個根據Google DeepMind團隊的論文所進行的AlphaGo開放式複製計畫 https://github.com/Rochester-NRT/AlphaGo 其實那篇論文講的大概已經有七八成 要做到小規模的複製應該沒什麼問題 最主要是透過複製的嘗試去實際理解AlphaGo的運 ...