圍棋AI AlphaGo 之我見 - 圍棋

Rosalind · 2016-03-14

Table of Contents

Post
Comments
Related Posts

1. 據說 AlphaGo用到的Neuro Network深達13層

有任何穩定性的報告或是說明嗎？

2. 圍棋的勝敗至少包括兩種，一種是壓著打或是完勝，另一種是反敗為勝

AlphaGo的設計應該是循著第一條路線

問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜

反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)

不曉得這會不會是AlphaGo昨天崩潰的原因？

3. 以現在AG的能力，它應該可以先歸類/分群將之前訓練的棋譜分開

重新訓練時只採用第一種壓著打或是完勝的棋譜

也許就不會有無理手的出現了 (或數學上讓它的系統參數穩定)

--

All Comments

Delia2016-03-16

AG設計團隊的理念應該是要盡量消除人類的影響因素 (?

Hamiltion2016-03-20

好像有可能

Harry2016-03-21

所謂的13層應該是指AG的神經網路中的隱藏層有13層吧

Lydia2016-03-24

2.3點不會有衝突嗎?

Skylar Davis2016-03-26

我覺得很多人都想太多了, AlphaGO 根本不是在下圍棋
它只是在進行"從過去棋譜和自我對奕學到的一種數學計算"

Andrew2016-03-27

中間的參數設定沒看到有人介紹過(多數人應該也沒興趣)

Hazel2016-03-28

像估值網路的訓練可以說是從白紙一張開始沒人說的清楚

Eartha2016-03-30

怎麼訓練法結果會比較好(絕對不是亂倒棋譜進去)

Rae2016-04-03

誰也不知道之後棋譜洗掉的alphaGO會變的如何？

Kama2016-04-03

希望是成為以宇宙流為主的棋手，但人類就難以模仿

Daniel2016-04-08

如果演算法真的能創造出典範轉移難以模仿也可以喲~~

Hazel2016-04-09

期待今後AlphaGo發展出宇宙流的死活題給大家解

Kumar2016-04-09

簡單來說昨天ag應該是沒有意識到出棋了才會下ㄧ堆損棋

Megan2016-04-10

3.的話誰來判斷呢？2.的話我覺得會有負面影響，但自我學習
有機會把那些負面影響扳回來

Emma2016-04-13

3的確是棘手的問題，大數據的labelling，可用value network

Necoo2016-04-17

試試