專訪鳳凰圍棋:訓練兩個多月跑譜只用CPU - 圍棋
By Elma
at 2018-04-30T19:40
at 2018-04-30T19:40
Table of Contents
http://sports.sina.com.cn/go/2018-04-30/doc-ifzvpatr4233961.shtml
“貝瑞基因杯”2018世界人工智能圍棋大賽今晚閉幕,來自騰訊微信團隊的鳳凰圍棋在決
賽三番棋中以2:1力挫老牌的王者絕藝,首次亮相世界賽就摘得了桂冠。 賽后,獅子頭
迫不及待,找到了沉浸在勝利喜悅中的團隊,進行了採訪。
獅子頭:恭喜鳳凰圍棋(以下金毛)獲得人工智能圍棋世界大賽的冠軍,先介紹一下創造
神奇的團隊吧。
金毛:謝謝! 很高興接受弈客的採訪。 好汗顏,我們的團隊都不太會下圍棋,最高水平
可能在18K以下吧(笑)。 團隊的開發工程師有5位。
金毛:我們是微信AI團隊的一部分。 微信中有很多AI的業務,比如語音輸入法,英中互
譯。 我們的主業是做微信翻譯。 去年10月份,Deepmind的Zero論文發布不久,我們正好
有一些空餘時間,當時我們正在做一個很大的基於雲端的人工智能訓練平台,支持包括深
度學習在內的各種機器學習模型,我們需要有一個東西去完善我們這個平台,同時我們也
想學一下最新的AI技術,看到Zero論文之後,我們覺得Zero的想法非常棒,正好符合我們
的想法。
獅子頭:從算法層面,除了遵循“Zero”的算法,有沒有其他更新的研究?
金毛:首先我們會根據TA的最基本想法,不會使用人類的棋譜進行訓練。 但是我們真的
沒有Deepmind那麼多資源,我們沒有幾千個GPU,所以就回到前面說的那個基於雲端
的一個機器訓練平台,我們是使用微信的後台空閒的服務器資源。 當晚上微信服務器比
較空閒的時候,它就左右互搏,幫我們去生成一些棋譜。 這些服務器白天的時候是要服
務微信用戶的(微信聊天、朋友圈等)。 生成棋譜基本上是由CPU服務器完成,做神經網
絡的訓練,還是用了那麼一兩台GPU服務器。
獅子頭:您預測什麼時候能真正達到AlphaZero最終的水平?
金毛:首先沒那麼多硬件資源,也不可能有那麼多的資源投放進去。 其次我們需要精打
細算,做一些效率改進,提升訓練的效率,因此不可能很快達到它的水平。 去年10月份
論文公佈,我們開始學習,到了春節前,大約1月份開始嘗試在網上進行一些實戰,真正
開始大規模的訓練是在大概春節後;所以我們到現在為止也就大概訓練兩個多月,我們見
縫插針地使用空閒的服務器,任何一台服務器忙了我們就不能使用。 在目前的狀態下,
我們也很難預測什麼時候能達到AlphaZero的水平。 一切還得看微信服務器的空閒資源。
獅子頭:LeelaZero 已經訓練了大致700萬譜,每天還在不斷增強。 AlphaZero總共訓練
了2700萬譜,你們準備訓練多少?
金毛:我們的路徑不太一樣,我們需要提高效率,使用更少的訓練量達到滿意的效果。
獅子頭:這個項目還會繼續嗎,還會繼續參加AI的世界大賽?
金毛:一切都還不確定,目前我們已經達到了一個里程碑,階段性的目標已經完成,這次
參賽本來覺得進入決賽就非常滿意了,拿到冠軍實在喜出望外。
獅子頭:這次參加比賽之前,有沒有對其他AI做一些了解?
金毛:我們所有的對局大家都能看到。 我們在明別人在暗。 別人的馬甲上來打我們,也
是幫我們測試了:)。 我們需要按照一個系統工程方法,保證忠實的實現。 第一是忠實
實現;第二提高我們的訓練效率,因為我們沒有那麼多GPU;第三就是說我們的雲訓練平
台要進一步完善。
獅子頭:預測一下現在你的這個棋力和比如說像柯潔這樣職業頂尖棋手,他們跟和你差距
有多大?
金毛:如果您觀察我們公開的歷史棋譜,其實上面有很多局,我們都是用一台家用的單機
在打,甚至配置比一個單卡的1080Ti還要低。 根據這些線索大致可以估計我們的棋力水
平。 實際上我們沒有嚴格去做過類似的測試。
獅子頭:今後有計劃到其他圍棋賽事上繼續表演嗎?
金毛:我們最初覺得能進決賽已經很開心了,現在拿到冠軍更是意外之喜,這個目標已經
完成了。 所以下一步可能我現在也沒法做一個決定,我們需要繼續討論。 我們這個團隊
本來的目標也不是為了做出一款圍棋產品,只是想這個機會學習學和實踐AI新技術。
獅子頭:現在的Block已經達到幾層了?
金毛:稍候我們會詳細公佈金毛的一些指標,我們使用家用機的配置和職業棋手較量,如
果Block太高,機器可能根本跑不起來。
獅子頭:有些AI,比如星陣,除了下貼七目半的圍棋以外,可以做到動態改變貼目數。
現在大部分的AI都是根據勝率來下棋,在確保勝率的情況下,他的棋風可能會偏向退縮,
保守? 你們是不是已經儲備了可以用動態貼目,包括下出這種追求極致不退讓棋風等技
術儲備?
金毛:我們對於星陣了解也是剛剛開始。 我們主要是做Zero的方法。 我們覺得也許人類
的一些認識跟AI的認識是不一樣,沒有退縮一說。 他就是追求勝利,那你勝率提高,你
說他是退縮還是不退縮呢?
--
“貝瑞基因杯”2018世界人工智能圍棋大賽今晚閉幕,來自騰訊微信團隊的鳳凰圍棋在決
賽三番棋中以2:1力挫老牌的王者絕藝,首次亮相世界賽就摘得了桂冠。 賽后,獅子頭
迫不及待,找到了沉浸在勝利喜悅中的團隊,進行了採訪。
獅子頭:恭喜鳳凰圍棋(以下金毛)獲得人工智能圍棋世界大賽的冠軍,先介紹一下創造
神奇的團隊吧。
金毛:謝謝! 很高興接受弈客的採訪。 好汗顏,我們的團隊都不太會下圍棋,最高水平
可能在18K以下吧(笑)。 團隊的開發工程師有5位。
金毛:我們是微信AI團隊的一部分。 微信中有很多AI的業務,比如語音輸入法,英中互
譯。 我們的主業是做微信翻譯。 去年10月份,Deepmind的Zero論文發布不久,我們正好
有一些空餘時間,當時我們正在做一個很大的基於雲端的人工智能訓練平台,支持包括深
度學習在內的各種機器學習模型,我們需要有一個東西去完善我們這個平台,同時我們也
想學一下最新的AI技術,看到Zero論文之後,我們覺得Zero的想法非常棒,正好符合我們
的想法。
獅子頭:從算法層面,除了遵循“Zero”的算法,有沒有其他更新的研究?
金毛:首先我們會根據TA的最基本想法,不會使用人類的棋譜進行訓練。 但是我們真的
沒有Deepmind那麼多資源,我們沒有幾千個GPU,所以就回到前面說的那個基於雲端
的一個機器訓練平台,我們是使用微信的後台空閒的服務器資源。 當晚上微信服務器比
較空閒的時候,它就左右互搏,幫我們去生成一些棋譜。 這些服務器白天的時候是要服
務微信用戶的(微信聊天、朋友圈等)。 生成棋譜基本上是由CPU服務器完成,做神經網
絡的訓練,還是用了那麼一兩台GPU服務器。
獅子頭:您預測什麼時候能真正達到AlphaZero最終的水平?
金毛:首先沒那麼多硬件資源,也不可能有那麼多的資源投放進去。 其次我們需要精打
細算,做一些效率改進,提升訓練的效率,因此不可能很快達到它的水平。 去年10月份
論文公佈,我們開始學習,到了春節前,大約1月份開始嘗試在網上進行一些實戰,真正
開始大規模的訓練是在大概春節後;所以我們到現在為止也就大概訓練兩個多月,我們見
縫插針地使用空閒的服務器,任何一台服務器忙了我們就不能使用。 在目前的狀態下,
我們也很難預測什麼時候能達到AlphaZero的水平。 一切還得看微信服務器的空閒資源。
獅子頭:LeelaZero 已經訓練了大致700萬譜,每天還在不斷增強。 AlphaZero總共訓練
了2700萬譜,你們準備訓練多少?
金毛:我們的路徑不太一樣,我們需要提高效率,使用更少的訓練量達到滿意的效果。
獅子頭:這個項目還會繼續嗎,還會繼續參加AI的世界大賽?
金毛:一切都還不確定,目前我們已經達到了一個里程碑,階段性的目標已經完成,這次
參賽本來覺得進入決賽就非常滿意了,拿到冠軍實在喜出望外。
獅子頭:這次參加比賽之前,有沒有對其他AI做一些了解?
金毛:我們所有的對局大家都能看到。 我們在明別人在暗。 別人的馬甲上來打我們,也
是幫我們測試了:)。 我們需要按照一個系統工程方法,保證忠實的實現。 第一是忠實
實現;第二提高我們的訓練效率,因為我們沒有那麼多GPU;第三就是說我們的雲訓練平
台要進一步完善。
獅子頭:預測一下現在你的這個棋力和比如說像柯潔這樣職業頂尖棋手,他們跟和你差距
有多大?
金毛:如果您觀察我們公開的歷史棋譜,其實上面有很多局,我們都是用一台家用的單機
在打,甚至配置比一個單卡的1080Ti還要低。 根據這些線索大致可以估計我們的棋力水
平。 實際上我們沒有嚴格去做過類似的測試。
獅子頭:今後有計劃到其他圍棋賽事上繼續表演嗎?
金毛:我們最初覺得能進決賽已經很開心了,現在拿到冠軍更是意外之喜,這個目標已經
完成了。 所以下一步可能我現在也沒法做一個決定,我們需要繼續討論。 我們這個團隊
本來的目標也不是為了做出一款圍棋產品,只是想這個機會學習學和實踐AI新技術。
獅子頭:現在的Block已經達到幾層了?
金毛:稍候我們會詳細公佈金毛的一些指標,我們使用家用機的配置和職業棋手較量,如
果Block太高,機器可能根本跑不起來。
獅子頭:有些AI,比如星陣,除了下貼七目半的圍棋以外,可以做到動態改變貼目數。
現在大部分的AI都是根據勝率來下棋,在確保勝率的情況下,他的棋風可能會偏向退縮,
保守? 你們是不是已經儲備了可以用動態貼目,包括下出這種追求極致不退讓棋風等技
術儲備?
金毛:我們對於星陣了解也是剛剛開始。 我們主要是做Zero的方法。 我們覺得也許人類
的一些認識跟AI的認識是不一樣,沒有退縮一說。 他就是追求勝利,那你勝率提高,你
說他是退縮還是不退縮呢?
--
Tags:
圍棋
All Comments
By Liam
at 2018-05-03T01:37
at 2018-05-03T01:37
By Wallis
at 2018-05-07T04:31
at 2018-05-07T04:31
By Daph Bay
at 2018-05-09T23:18
at 2018-05-09T23:18
By Belly
at 2018-05-12T06:09
at 2018-05-12T06:09
By Isabella
at 2018-05-14T18:27
at 2018-05-14T18:27
By Damian
at 2018-05-18T09:57
at 2018-05-18T09:57
Related Posts
(視頻)2018年 AI圍棋人機大戰 柯潔vs星陣
By Hedy
at 2018-04-28T10:30
at 2018-04-28T10:30
對弈中國圍棋AI 柯潔輸了
By Bethany
at 2018-04-28T00:34
at 2018-04-28T00:34
許皓鋐五段獲得第十屆海峰盃冠軍
By Lauren
at 2018-04-26T16:05
at 2018-04-26T16:05
日本兩日制的棋賽會不會有問題?
By Carol
at 2018-04-26T10:52
at 2018-04-26T10:52
2018年圍甲聯賽第4輪 崔哲瀚vs檀嘯(兩場)
By Erin
at 2018-04-25T23:02
at 2018-04-25T23:02