AlphaZero如果突然給它20x20的棋盤 - 圍棋

Ursula · 2019-06-15

Table of Contents

Post
Comments
Related Posts

這個演示非常令人驚訝，但哈薩比斯還是有所保留。如果虛擬平板略微往上移動一點點，
程式就會失敗。DeepMind程式所學到的技能是如此受限制－－它甚至無法對環境的微小變
化（比人類走路時對環境產生的微小影響還小）作出反應－－至少在沒有數千輪強化學習
的情況下既是如此。但是現實世界已經內置了這樣的應對系統。
https://tinyurl.com/yydt55tn

Deepmind老大說

即使是已經訓練好的「打磚塊」遊戲AI

只要遊戲設定做個微小的調整

AI就會失敗

需要再更多的訓練，才能因應新的狀況

圍棋「人類」棋手如果突然面對20x20的棋盤

可能對棋力沒什麼影響

那麼如果突然讓目前最強圍棋AI「AlphaZero」和人類下20x20

AI可能會表現的如何？

thanks

--

All Comments

Mary2019-06-20

前幾盤可能可以贏吧

Mia2019-06-24

我覺得這個議題蠻好的值得一試

Lily2019-06-27

如果什麼都不動，alphago不能下20路圍棋，因為連輸
入只能是19路棋盤，但是如果經過一些技巧訓練個1天
，贏過人類還是綽綽有餘

George2019-07-01

應該要重新train吧但只要input維度改一下其他架構大概
可以沿用感覺是這樣

Vanessa2019-07-05

之前用leela跑19路之外，全部都當成19路在下

Frederica2019-07-09

有影響但不會到非常劇烈
對人類而言

Olive2019-07-11

主要是cnn對邊緣太敏感提供座標給cnn能部分解決問題
圍棋的話多輸入盤面大小應該任意盤面都能共用網路吧

Linda2019-07-12

其實了解深度學習的話就知道這沒什麼好驚訝的啊XD

Necoo2019-07-13

@AmibaGelos 把棋盤大小也都當參數當然也不是不行，但這樣
實質上等價於每種大小的棋盤分別訓練，甚至未必比較好

Olga2019-07-13

你如果想要用這種方式把20x20也同時訓練起來，造成的結果
就是所花的時間（或訓練到一定棋力所需局數）就是19x19所

Freda2019-07-15

需 + 20x20所需，至少以現有架構而言它沒有學習不同盤面大

Anonymous2019-07-18

小共通知識的能力。未來技術再發展也許慢慢會往這邊前進，

Tom2019-07-22

人類舉一反三的能力一直都是共通型AI的長遠目標

Barb Cronin2019-07-27

不一定吧如果有無關盤面大小的準則的話大小就標定
邊緣而已類似標定黑白策略確實不同但不是不會重疊

Barb Cronin2019-07-27

人家AI就跟人類不一樣啊

Barb Cronin2019-07-29

AI目前這種學習方式就是學不到那樣的通則

Frederic2019-07-31

現在是貼目數不同都會無法完全通用的狀態，AI學不到那種「

Isla2019-08-03

我把現在當作落後所以攻兇一點就搞定了」的轉換性概念。當
然有一組AI的目標設定為就算領先也會盡可能繼續取得目數而

Lydia2019-08-07

不要退守，那個設定就相對能應付貼目改變問題，但付出的代

Hazel2019-08-08

價就會是潛在的安定性。

Belly2019-08-12

至於盤面大小，現況是不同盤面肯定要重新訓練的情況，不然

Sandy2019-08-15

別說複雜細算了，征子算錯的情況都有可能發生。在19路棋盤

Robert2019-08-18

訓練出來的模組採用一個征子有利的下法，到了20路變成征子

Isla2019-08-19

不利，深度學習選取棋步時可能並不會發現這個問題

Hamiltion2019-08-20

這點反而是傳統搜尋式AI有機會搜尋下去發現問題，搜尋層數
足夠的話。

Belly2019-08-25

也許吧有空設計個網路混合訓練6*6~9*9 應該很有趣xd

Skylar Davis2019-08-29

說到征子，以現在的架構，盤面越大征子好像要練訓越久?
理論上好像越大的棋盤人類越有機會用征子套爆AI

Jacob2019-09-01

應該說本來手數多的套路如大型定石、長時間劫爭這些本來就
是要訓練更多局才會有機率覆蓋到完整最佳著手

Brianna2019-09-02

征子本來可以視為一個很長的套路，然而征子是一個人類能
夠用共通概念推理快速簡化計算的特例，圍棋AI沒有這種簡
化概念，需要真的實際算過

David2019-09-04

所以盤面越大當然就大幅增加訓練時間。一方面要模擬完一
局需要更久，而獲取足夠資訊所需的訓練對局數也大幅增加

Blanche2019-09-04

@AmibaGelos 混合訓練不同大小目前事實上就是無意義啦。
對AI問題是全等於分開訓練，而且反而有可能因為對於盤面大
小這個參數的模糊化導致模型品質的下降

Oscar2019-09-06

以人類觀點來說這不就叫做不知變通嗎XD