淺談AlphaGo - 圍棋
By Yedda
at 2017-01-05T14:05
at 2017-01-05T14:05
Table of Contents
※ 引述《ykes60513 (いちご)》之銘言:
: 這幾天 AI又帶給了大家新的衝擊
: AlphaGo又再次進化了 而且遠超乎大家的想像
: 顯然之後AI會更加深入這塊圈子
: 影響只會越來越廣 不得不深思要怎麼看待這場新的革命
: 雖然有些人說AI能使圍棋的發展更進一步 但坦白說我是有些悲觀的
: 因為從本質上AlphaGo就跟人類差太多了
: 首先 AlphaGo的演算法是追求勝率最高
: 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 因為對它來說目數不重要 只要能贏就夠了
其實這也不算顛覆的概念,學棋的時候老師也會教你,殺了大龍或大幅領先幾
乎勝定的時候,你甚至可以自己走幾手單官來確保殺得乾乾淨淨不會出棋
只是人的行棋沒有電腦那麼精準,對棋力低的可能領先二十目才能下得這麼保
守,不然很可能被翻盤。高手可能十目就能保持勝勢,對電腦可能就是兩目他
就可以這樣下了
: 另外 AlphaGo都是在做全域運算 它沒有局部的概念
: 這兩點就跟人類的思考方式南轅北轍
: 難怪有人看了AlphaGo的棋感嘆 之前所學的都是錯的
: 就因為兩者的基礎點不同 也可說是演算法的不同 當然演化出來的棋路會有差別
我覺得說他沒有局部概念也不正確,AI取點模擬的時候不會全盤每個點都等價
,他用訓練出的棋感來猜的時候局部的點一定猜得多。只是說他的模擬方式是
全局下完而已
"過去學得都是錯的"我覺得只是柯潔誇飾性的說法。AI多數行棋也還在人的理
解範圍,會有下完不知道怎麼輸的原因就是他棋力更高。就像低段跟高段下,
明明感覺每個區域都是照定石走,可是就是下不贏這種感覺吧,因為對方子效
就是比你高
當然一定會有顛覆的地方,因為人類對前期的下法好壞本來就是模糊不太確定
的,看布局跟定石都是一陣陣流行的就很明顯。有時候過去覺得不好的定石重
新被拿出來用,結果變成標準型,就知道人對這種東西的判斷是不準確的
比方說AI的五路尖衝,過去棋理告訴人說被四路圍空是吃虧的,但或許這是建
立在一般人對外勢的運用效率不夠好的原因下。看AI的對局,它的外勢不是最
終成空就是能配合攻擊在其他地方取利。人類當然也知道攻擊取利順勢圍空這
些道理,但看AI的對手的外勢常常最後就變單官或是兩眼做活,這就是棋力差
異造成的
: 而哪邊更加接近圍棋之神呢 相信AlphaGo已給出了答案
: 你可以說人類一直都用錯誤的方法學圍棋
: 但這是人類生理上的拘限性所導致的
: 我們幾乎永遠不可能像AlphaGo那樣思考
: 比起目數 勝率那種東西是虛無飄渺的 人類又怎麼能量化呢
: 當然只能計算目數
: 所以說要向AI學習 我是有些疑問的 要怎麼學呢
: AlphaGo會告訴你要那樣下 但為什麼? 不知道
: 你沒法把AlphaGo的棋路內化 因為思考模式就不同
: 頂多只能依樣畫葫蘆
: 這樣的學習效果是有限的
人類不可能用勝率模擬,所以目數是最精確的評估了。人類在小區域對目數的
判斷應該是可以更勝電腦的。比方說一個手筋可以掏掉幾目、每個官子價值多
少、局部死活,這些都是人類已經用窮舉法確定的東西了。只要電腦是用機率
在模擬,這些部分就不會超過人類(人類自己眼殘或腦袋打結的情況先忽略XD)
能不能照學的確是有疑問的,像前面說的,人學AI搶了外勢,理論上不虧,可
是人類能將那道牆運用得跟電腦一樣好嗎?或是像點三三,AI說下完先手他不
虧,但你棋力不到,你搶了先手卻佔不到急場,那你的先手價值就不像AI模擬
的能提高勝率了。也就是說要學AI可能不能只學個走法,你得把他後續的整個
應用的方法稍微搞懂這樣學了才有意義
: 我想過如果AlphaGo不追求最大勝率 而是最大目數的話會如何
: 這樣發展出的圍棋會不會更接近人類呢
: 這樣的發展或許會很有意思
: 相對的 我們對人類至今發展出的圍棋也不需太過悲觀
: 雖然舊的棋路 定石在AlphaGo 甚至圍棋之神眼中或許是錯的
: 但我們還是得擁抱它
: 因為我們是人類
: 不是AlphaGo
我猜測AI反覆使用的型應該是他確定有好處的下法,可以研究。但不見得他每
個走法都是最優。其實從AI的下棋邏輯就可以理解,他既然是靠機率,選的就
不一定是"只此一手"最佳解,只是通常能選到"相對佳"的著手。
人類為什麼下不贏呢?因為人失誤更多,可能某個區域人類細算後選到更佳解
或最佳解賺了三目,但其他小地方一下虧五目一下虧兩目,那盤面還是一直被
牽著走。
其實人類也是求勝而不是追求最大目數,人類會想多追目是因為目數領先越多
對人類來說等同勝率越高,也就是人類很清楚意識到自己會失誤所以留給自己
緩衝失誤的空間。
--
: 這幾天 AI又帶給了大家新的衝擊
: AlphaGo又再次進化了 而且遠超乎大家的想像
: 顯然之後AI會更加深入這塊圈子
: 影響只會越來越廣 不得不深思要怎麼看待這場新的革命
: 雖然有些人說AI能使圍棋的發展更進一步 但坦白說我是有些悲觀的
: 因為從本質上AlphaGo就跟人類差太多了
: 首先 AlphaGo的演算法是追求勝率最高
: 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 因為對它來說目數不重要 只要能贏就夠了
其實這也不算顛覆的概念,學棋的時候老師也會教你,殺了大龍或大幅領先幾
乎勝定的時候,你甚至可以自己走幾手單官來確保殺得乾乾淨淨不會出棋
只是人的行棋沒有電腦那麼精準,對棋力低的可能領先二十目才能下得這麼保
守,不然很可能被翻盤。高手可能十目就能保持勝勢,對電腦可能就是兩目他
就可以這樣下了
: 另外 AlphaGo都是在做全域運算 它沒有局部的概念
: 這兩點就跟人類的思考方式南轅北轍
: 難怪有人看了AlphaGo的棋感嘆 之前所學的都是錯的
: 就因為兩者的基礎點不同 也可說是演算法的不同 當然演化出來的棋路會有差別
我覺得說他沒有局部概念也不正確,AI取點模擬的時候不會全盤每個點都等價
,他用訓練出的棋感來猜的時候局部的點一定猜得多。只是說他的模擬方式是
全局下完而已
"過去學得都是錯的"我覺得只是柯潔誇飾性的說法。AI多數行棋也還在人的理
解範圍,會有下完不知道怎麼輸的原因就是他棋力更高。就像低段跟高段下,
明明感覺每個區域都是照定石走,可是就是下不贏這種感覺吧,因為對方子效
就是比你高
當然一定會有顛覆的地方,因為人類對前期的下法好壞本來就是模糊不太確定
的,看布局跟定石都是一陣陣流行的就很明顯。有時候過去覺得不好的定石重
新被拿出來用,結果變成標準型,就知道人對這種東西的判斷是不準確的
比方說AI的五路尖衝,過去棋理告訴人說被四路圍空是吃虧的,但或許這是建
立在一般人對外勢的運用效率不夠好的原因下。看AI的對局,它的外勢不是最
終成空就是能配合攻擊在其他地方取利。人類當然也知道攻擊取利順勢圍空這
些道理,但看AI的對手的外勢常常最後就變單官或是兩眼做活,這就是棋力差
異造成的
: 而哪邊更加接近圍棋之神呢 相信AlphaGo已給出了答案
: 你可以說人類一直都用錯誤的方法學圍棋
: 但這是人類生理上的拘限性所導致的
: 我們幾乎永遠不可能像AlphaGo那樣思考
: 比起目數 勝率那種東西是虛無飄渺的 人類又怎麼能量化呢
: 當然只能計算目數
: 所以說要向AI學習 我是有些疑問的 要怎麼學呢
: AlphaGo會告訴你要那樣下 但為什麼? 不知道
: 你沒法把AlphaGo的棋路內化 因為思考模式就不同
: 頂多只能依樣畫葫蘆
: 這樣的學習效果是有限的
人類不可能用勝率模擬,所以目數是最精確的評估了。人類在小區域對目數的
判斷應該是可以更勝電腦的。比方說一個手筋可以掏掉幾目、每個官子價值多
少、局部死活,這些都是人類已經用窮舉法確定的東西了。只要電腦是用機率
在模擬,這些部分就不會超過人類(人類自己眼殘或腦袋打結的情況先忽略XD)
能不能照學的確是有疑問的,像前面說的,人學AI搶了外勢,理論上不虧,可
是人類能將那道牆運用得跟電腦一樣好嗎?或是像點三三,AI說下完先手他不
虧,但你棋力不到,你搶了先手卻佔不到急場,那你的先手價值就不像AI模擬
的能提高勝率了。也就是說要學AI可能不能只學個走法,你得把他後續的整個
應用的方法稍微搞懂這樣學了才有意義
: 我想過如果AlphaGo不追求最大勝率 而是最大目數的話會如何
: 這樣發展出的圍棋會不會更接近人類呢
: 這樣的發展或許會很有意思
: 相對的 我們對人類至今發展出的圍棋也不需太過悲觀
: 雖然舊的棋路 定石在AlphaGo 甚至圍棋之神眼中或許是錯的
: 但我們還是得擁抱它
: 因為我們是人類
: 不是AlphaGo
我猜測AI反覆使用的型應該是他確定有好處的下法,可以研究。但不見得他每
個走法都是最優。其實從AI的下棋邏輯就可以理解,他既然是靠機率,選的就
不一定是"只此一手"最佳解,只是通常能選到"相對佳"的著手。
人類為什麼下不贏呢?因為人失誤更多,可能某個區域人類細算後選到更佳解
或最佳解賺了三目,但其他小地方一下虧五目一下虧兩目,那盤面還是一直被
牽著走。
其實人類也是求勝而不是追求最大目數,人類會想多追目是因為目數領先越多
對人類來說等同勝率越高,也就是人類很清楚意識到自己會失誤所以留給自己
緩衝失誤的空間。
--
Tags:
圍棋
All Comments
By Elizabeth
at 2017-01-07T11:37
at 2017-01-07T11:37
By Jessica
at 2017-01-12T09:04
at 2017-01-12T09:04
By Daph Bay
at 2017-01-16T17:09
at 2017-01-16T17:09
By Kyle
at 2017-01-20T14:37
at 2017-01-20T14:37
By Oliver
at 2017-01-24T19:04
at 2017-01-24T19:04
By Isla
at 2017-01-25T21:38
at 2017-01-25T21:38
By Isla
at 2017-01-25T23:59
at 2017-01-25T23:59
By Olga
at 2017-01-26T12:54
at 2017-01-26T12:54
By Steve
at 2017-01-27T20:52
at 2017-01-27T20:52
By Freda
at 2017-01-31T17:37
at 2017-01-31T17:37
By Daniel
at 2017-02-02T01:16
at 2017-02-02T01:16
By Oliver
at 2017-02-06T14:49
at 2017-02-06T14:49
By Harry
at 2017-02-10T09:54
at 2017-02-10T09:54
By Mia
at 2017-02-14T17:18
at 2017-02-14T17:18
By Belly
at 2017-02-16T13:58
at 2017-02-16T13:58
By Xanthe
at 2017-02-20T09:21
at 2017-02-20T09:21
By Candice
at 2017-02-25T02:40
at 2017-02-25T02:40
By Doris
at 2017-02-25T08:48
at 2017-02-25T08:48
By Olive
at 2017-02-27T03:27
at 2017-02-27T03:27
By Andrew
at 2017-03-03T17:39
at 2017-03-03T17:39
By Cara
at 2017-03-06T11:43
at 2017-03-06T11:43
By Poppy
at 2017-03-08T18:25
at 2017-03-08T18:25
By Kristin
at 2017-03-08T23:16
at 2017-03-08T23:16
By Eden
at 2017-03-09T21:45
at 2017-03-09T21:45
By Kumar
at 2017-03-10T17:49
at 2017-03-10T17:49
By Daph Bay
at 2017-03-12T10:04
at 2017-03-12T10:04
Related Posts
有Master全60局的棋譜嗎?
By Harry
at 2017-01-05T14:04
at 2017-01-05T14:04
職業棋士的水平 vs AlphaGo
By Eden
at 2017-01-05T12:01
at 2017-01-05T12:01
淺談AlphaGo
By Quintina
at 2017-01-05T11:46
at 2017-01-05T11:46
淺談AlphaGo
By Candice
at 2017-01-05T11:19
at 2017-01-05T11:19
從Alphago黃博士看圍棋界的變革與未來
By Rachel
at 2017-01-05T11:01
at 2017-01-05T11:01