圍棋AI給出的手段，難道就是正解嗎？ - 圍棋

Lily · 2023-04-03

Table of Contents

Post
Comments
Related Posts

【安靜】圍棋AI給出的手段，難道就是正解嗎？

騰訊圍棋

作者：找藉口安靜點擊：2472023-04-03 13:25

圖片

原址：https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html

原題：AIの手は正解なのか～大橋拓文七段と考えるAIとの付き合い方「つるりん式観る
碁のすすめ～こぼれ話」

摘自：日本棋院

作者：編輯K

翻譯和整理：找藉口安靜這篇比較長就翻了

https://www.foxwq.com/Public/Uploads/image/20230403/t_16804987161.peg

這一次我們請了學術類鋼琴家，被譽為是太空人的大橋拓文七段。大橋拓文的鋼琴水平應
該是棋界第一人，對圍棋AI方面有著非常廣泛的知識，在經常下出一些AI手段的同時，還
研究AI是不是有極限，AI認為的最強手段是怎麼定義的，從科學和哲學領域對其進行研究
。

當今AI已經成為了觸手可及的工具，想到AI就想到能給我們準確的下法。將實力的基準提
升到了和AI的吻合度。但是AI真的是正確的嗎？難道提升和AI的吻合度才能是接近最好手
段的方式嗎？

在這個專欄中，我們直接把這些問題拋給大橋拓文，對AI的現狀進行探究。AI實力強勁，
並且能看到絕對的結論。而AI給我們顯示的手段，是不是我們想到的神之一手呢？我們借
此來瞭解一下深奧的AI世界的冰山一角。

——大橋拓文七段今天請多關照。

大橋拓文：請多關照。

——長話短說我們想針對AI進行採訪，AlphaGo出現至今已有7年多，AI現在已經成為了我
們觸手可及的東西。現在棋手們用AI進行研究已經是常態，在直播中用AI勝率值進行表示
，還用AI顯示出當前局面的推薦手段。拿自己來說，我在看棋的時候也會下意識地把AI給
出的手段當作是“正解”，實際上你覺得AI給出的手段就真的是“正解”嗎？

大橋拓文：這個確實很複雜，首先我們要對“正解”進行定義。多數情況下，下出比人類
更加精准，並且能贏棋的手段，我覺得比較接近于“正解”的。

——也就是說這不是“正解”，應該是屬於“最佳”。那你覺得AI給出的手段是“最佳”
手段嗎？

大橋拓文：我們先不談人類怎麼接受這些下法，首先AI是沒有“最佳”的概念的。在這種
情況下來評判“最佳”，是不是覺得是一件很困難的事情呢？比如說用最短的手數贏棋，
還是贏最多的目數，你覺得哪一個才是“最佳”呢？

——這麼說還挺有道理的，這兩個角度其實都可以認為是“最佳”。

大橋拓文：剛剛我也提到了AI沒有“最佳”的概念，但是AI在選擇每一手棋的之後，都有
著
“獲勝”的目標。然後如何設定“獲勝”的方式，就取決於各個AI的個性了。實際上這都
是由設計程序的人類設計而反映出的結果。

——這是什麼原因呢？

大橋拓文：比如說，AlphaGo把最終的目標定在“贏棋”，然後選擇避開高風險的手段，
選擇了贏半目的下法。所以就會選擇一些人類看上去可能會虧損的手段，但是AI依舊會選
擇安全的下法。後來就出現了從“以更大的目數獲勝”的AI。這就和“哥倫布的雞蛋”一
樣，因為追求更大的目數的AI比追求僅僅“贏”的AI更強大，但並不一定需要刻意去製作
一個追求更大目數的AI。總之相較於AlphaGo時代的AI，現在的AI越來越傾向于選擇高風
險高回報。

——棋風和人類一樣很有意思。

大橋拓文：進一步來說，現在還出現了在佈局階段，通過對手的手段來推測實力。一旦判
斷“棋力較低”之後AI就會選擇比較保守手段的AI。當然這也是因為當初程序是這麼設計
的，所以看上去才會那樣，實際上被下套的人就覺得自己就和漫畫《棋魂》中的棋會所的
那個大叔一樣，感覺任何下法都被他看透了。

——確實有這種感覺，就覺得AI是富有人格的。

大橋拓文：我也有這種感覺，但是後來冷靜地告訴自己，這些都是通過計算得到的結果（
笑）。

——我們換一個話題，有的棋手說：“因為AI自己手段的範圍變廣了”，也有說“自己的
手段變窄了”。而你又是怎麼感覺的呢？

大橋拓文：從長遠角度出發是變廣了，但是目前處在過渡期，確實有些人會覺得範圍變窄
了。

——這是什麼原因呢？

大橋拓文：AI會通過自我對局來提升自己的水平。比如我你和相同棋力、相同棋風的人一
直下幾千或者幾萬盤，你覺得會不會漲棋呢？

——難道不會變強嗎？

大橋拓文：你覺得你和棋風一樣的人一直下棋，實力會變強嗎？

——我明白了。確實如果和棋風相同的人一直對局，那只會反復下一樣的佈局。到後來只
擅長某一個佈局，但是其他手段的話可能並非如此了。

大橋拓文：就是這個道理。通過電腦進行自我對局，重複進行幾萬盤相同的事情。說實話
我們也不知道他是不是聰明（笑）。不過像AlphaGo Zero那樣開發這一類AI的話，讓電腦
自我進行自我對局的操作也非常重要。不過開發下圍棋很強的AI的話，現階段還是需要通
過人類的設置，才能擴大研究的範圍。這些其實從KataGo的官方網站就能有所瞭解。實際
上現在的圍棋AI的佈局套路也變得越來越多。

——我看AI經常點三三，這或許可能不是因為這是好棋才這麼下，而是因為這手棋經常出
現，所以AI也這麼下了。如果AI今後變得更強的話，今後的AI定式有可能會和現在完全不
一樣，佈局也有可能變得多樣化。

大橋拓文：就是這個道理，還有就是和現在相關的話題，那就是我想強調AI“不會像人類
一樣有認知，也不會有理解能力”。你應該還記得，AlphaGo剛出現的時候，很不擅長征
子和大頭鬼。

——是的，明明這麼強，竟然不認識征子。

大橋拓文：現在的AI通過人類的設置，把AI不擅長的棋型程序化了，所以現在他們也知道
什麼是征子了，有的人可能會覺得，這麼簡單的事情還需要通過設置來解決挺不可思議的
。為什麼會出現這種情況呢？那就是AI不知道征子，也不會理解什麼是征子。其實不僅是
征子，其實連兩眼做活，AI也都是一知半解的。

——詳細說說。

大橋拓文：人類會通過倫理來考慮手段，通過棋型來識別征子的棋型。這樣理所當然的事
情其實AI是做不到的。與其說做不到，AI在這方面的思維方式就不一樣。圍棋AI會把自己
摸索的範圍作為自己的世界，但是自己摸索不到的地方它們是不知道的。簡單來說的話，
比如說有一個手數很長的征子，人類的話只要知道征子的棋型，哪怕是100手的征子也是
可以下完並且吃掉的。但是AI就沒有“重複做這個動作”的想法，每一手棋都需要摸索，
所以在計算100手的征子時，他們計算到50手就有可能算不下去了。

前段時間出現了只要找到AI的弱點，人類就能戰勝圍棋AI的事情成為了話題。實際上AI連
死活的改變也沒有。為了讓AI產生錯覺，讓AI把自己的棋走成一個環，這樣的話AI就會覺
得即便只有一隻眼也能活棋。以前AI就有只要不會被拔起來的棋，AI就有可能將其認為是
活棋的錯覺。但是只要讓AI的棋圍成一圈，AI就完全被我們套路的事情。在這方面相較于
棋手，很多職業遊戲玩家比我們更厲害（笑）。並且人類只要有10級左右的棋力，就能輕
輕鬆松識破這個弱點。人類至少知道兩眼活棋或者雙活的概念，但是對AI來說，我覺得他
們對兩眼活棋的概念應該還是一知半解的。

——能輕輕鬆松戰勝頂尖棋手的圍棋AI，竟然沒有“認知”和“理解”的概念還是很意外
的。

大橋拓文：真的是這樣，問題是從AI獲得手段的人類，可能一直會覺得這是AI的認知或者
是理解。對AI來說，他們學習的世界可能會比人類做得更好，但是在他們沒有學習到的世
界，很多人類可以輕輕鬆松做到的事情，AI有時候可能就做不到。所以我們要理解AI的基
礎上，如何和AI共同相處才是非常重要的。

——不把AI一切當成絕對的結果是很重要的事情。最後還想問的一個問題是，我們今後如
何和AI共同相處下去呢？

大橋拓文：我們每天都和各種AI進行對局，現在圍棋AI的實力面對人類棋手是碾壓式的強
大。我的話至少要受讓30目才行。在撲朔迷離的局面下，AI的形勢判斷也很準確，包括需
要計算的中盤對攻，雖然在這種情況下可能比形勢判斷要稍微遜色一些，不過很多時候還
是比人類棋手要強。利用AI進行學習是非常有用的事情，還有可能會擴大圍棋的可能性。
不過很多時候覺得AI給出的手段很容易被認為是正解，其實很多手段有可能是錯誤的，即
便是正確的，我們可能也很難下出最好的下法。也就是說AI給出的手段對我們來說是不是
好棋，這是我們需要判斷也是需要我們好好學習的地方。

——現在的AI技術，在圍棋以外的領域正逐步開始變得實用化。這一次提到的和圍棋AI的
相處方式，今後在身邊可能會有更多的AI出現，在這種情況下我們該如何相處，這一次確
實是學到了很多東西。今天非常感謝接受採訪。

https://www.foxwq.com/news/listid/id/14188.html

--

圍棋