圍棋AI AlphaGo 之我見 - 圍棋

By Mason
at 2016-03-15T08:30
at 2016-03-15T08:30
Table of Contents
※ 引述《mathbug (天堂的定義)》之銘言:
: 1. 據說 AlphaGo用到的Neuro Network深達13層
: 有任何穩定性的報告或是說明嗎?
論文裡有提到它預測的誤差
: 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝
: AlphaGo的設計應該是循著第一條路線
: 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
: 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
: 不曉得這會不會是AlphaGo昨天崩潰的原因?
所謂千萬盤是自我對奕, 不是人類實戰譜, 人類高手實戰譜還沒那麼多.
看它跟小李下的棋路, 是第一種路線多? 還是第二種多?
: 3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開
: 重新訓練時只採用第一種壓著打或是完勝的棋譜
: 也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定)
中間攻防輸掉是 AlphaGo 形勢判斷錯誤, 劣勢盤面還以為優勢繼續走損手.
後來左下角的挖被吞吃, 還有點影響到左邊黑棋的死活.
理論上決策樹會假設對方走最好的一手 (被吞吃), 而不是期待對方犯錯.
AlphaGo 有很多其他的著手選擇, 下起來都沒有那一手損導致勝率更低.
就算以 AI 的角度, 我也看不懂它在下甚麼.
難不成 AlphaGo 大幅落後時策略改成期待對方應錯翻盤?
--
: 1. 據說 AlphaGo用到的Neuro Network深達13層
: 有任何穩定性的報告或是說明嗎?
論文裡有提到它預測的誤差
: 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝
: AlphaGo的設計應該是循著第一條路線
: 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
: 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
: 不曉得這會不會是AlphaGo昨天崩潰的原因?
所謂千萬盤是自我對奕, 不是人類實戰譜, 人類高手實戰譜還沒那麼多.
看它跟小李下的棋路, 是第一種路線多? 還是第二種多?
: 3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開
: 重新訓練時只採用第一種壓著打或是完勝的棋譜
: 也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定)
中間攻防輸掉是 AlphaGo 形勢判斷錯誤, 劣勢盤面還以為優勢繼續走損手.
後來左下角的挖被吞吃, 還有點影響到左邊黑棋的死活.
理論上決策樹會假設對方走最好的一手 (被吞吃), 而不是期待對方犯錯.
AlphaGo 有很多其他的著手選擇, 下起來都沒有那一手損導致勝率更低.
就算以 AI 的角度, 我也看不懂它在下甚麼.
難不成 AlphaGo 大幅落後時策略改成期待對方應錯翻盤?
--
Tags:
圍棋
All Comments

By Lydia
at 2016-03-16T14:41
at 2016-03-16T14:41

By Caroline
at 2016-03-17T22:23
at 2016-03-17T22:23

By Iris
at 2016-03-22T13:25
at 2016-03-22T13:25

By Liam
at 2016-03-23T20:10
at 2016-03-23T20:10

By Agnes
at 2016-03-27T13:04
at 2016-03-27T13:04

By Brianna
at 2016-03-28T20:40
at 2016-03-28T20:40

By Franklin
at 2016-04-01T07:16
at 2016-04-01T07:16

By William
at 2016-04-04T09:16
at 2016-04-04T09:16

By Rachel
at 2016-04-08T12:29
at 2016-04-08T12:29
Related Posts
寺山憐日本圍棋苦寒的背影 望重新贏回尊重

By Isabella
at 2016-03-15T00:21
at 2016-03-15T00:21
韓國棋院遊記 以圍棋為事業的人們

By Kyle
at 2016-03-14T23:45
at 2016-03-14T23:45
第四局AlphaGo敗招的分析

By Aaliyah
at 2016-03-14T23:43
at 2016-03-14T23:43
關於那所謂的神之一手

By Jessica
at 2016-03-14T23:18
at 2016-03-14T23:18
ponanza橫掃業餘強豪

By Dinah
at 2016-03-14T22:23
at 2016-03-14T22:23