DeepMind AI與人類合作玩奪旗策略遊戲, - Steam

By Regina
at 2019-06-02T00:47
at 2019-06-02T00:47
Table of Contents
DeepMind AI與人類合作玩奪旗策略遊戲,表現與人類玩家相當
https://is.gd/Bt8fO6
DeepMind用強化學習訓練AI玩家,在複雜多人連線3D遊戲中的奪旗競賽場景,AI玩家的表
現已達人類水準
DeepMind最近發表用強化學習訓練AI模型的新進展,在複雜多人連線3D遊戲《雷神之鎚
III競技場》中的奪旗競賽場景,AI玩家的表現已達人類水準,能夠成功地與人類玩家合
作,不僅如此,該AI模型的研究成果,也可以擴展到《雷神之鎚III競技場》完整的遊戲
場景中,該研究顯示多代理人(multi-agent)訓練在AI領域開發上的潛力。
這個研究的目標是多代理人學習,也就是每個個別的代理人都必須獨立行動,並學會與其
他代理人互動和合作,DeepMind指出,地球上有數十億的人居住,每個人都有自己的目標
和活動,但是仍然可以透過團體組織和社會聚集在一起,展現出集體智慧,這就是
DeepMind期望AI玩家能學會的能力,不過,這也是一個非常困難的任務,因為環境一直在
改變。
為了研究這道難題,DeepMind利用3D第一視角的多人連線遊戲,來訓練AI模型,這些遊戲
能夠代表最受歡迎的遊戲種類,並且也因為沉浸式的遊戲方式,可以收集到數百萬遊戲玩
家的想像,也能使AI學習到策略、技巧、手眼協調和團隊合作,對AI玩家來說,挑戰是要
直接從原始的像素資料直接學習,並產生動作,這樣的複雜度也使得第一視角的多人連線
遊戲,成為豐富的AI訓練資源。
首先,DeepMind訓練AI玩家學習像其他玩家一樣行動,而且要學會與同隊的玩家合作,不
管是AI或是人類玩家,奪旗競賽的規則很簡單,但是動態的變化卻很複雜,兩個隊伍各自
的玩家要在給定的地圖上,搶奪對方隊伍的旗幟帶回自己的基地,同時又要保護自己隊伍
的旗幟,若點擊持有自己隊伍旗幟的敵對玩家,就能將旗幟送回原本的基地,在5分鐘內
擁有最多旗幟的隊伍即獲勝。
從遊戲AI玩家的角度來看,奪旗競賽需要玩家與團隊合作一起對抗敵人,為了讓研究變得
更有趣,DeepMind為奪旗競賽增添了一些變數,每個競賽中的地圖配置都不相同,如此一
來,AI玩家就被迫要找出通用的策略,而不是靠著記憶地圖來完成任務,除此之外,為了
確保競爭環境公平,AI玩家和人類玩家是用類似的方式玩奪旗遊戲,AI玩家觀察像素圖像
的串流資料,並透過模擬遊戲控制器來產生執行動作。
DeepMind所用的強化學習有3大概念,第一,DeepMind訓練了一群AI玩家,而不是只有一
個,因此,AI之間可以互相學習,提供多元的隊友或是敵人,第二,每個AI玩家都會學習
自己的內部獎勵訊號,使得AI產生自己的內部目標,像是搶奪旗幟,第三,AI玩家執行遊
戲的時間區段的分為快和慢兩種,來改善AI使用記憶體和產生一致行動序列的能力。
-------------------------------------------------------------------------------
AI也會團體戰 多玩家遊戲首擊敗人類
https://is.gd/cLwE5H
美國《科學》(Science)期刊五月三十日公佈最新研究指出,英國人工智慧科技公司「
DeepMind」已在多人連線射擊遊戲「雷神之鎚III競技場」(Quake III Arena )中,設
計出一種自動「代理人」,可以自我學習及展現人類般行為,並在與人類合作或對抗時,
對應地調整行為,已成功在該「奪旗」遊戲中首度擊敗人類。
這項研究的目的,是要建立能玩極端複雜3D電玩遊戲的人工智慧。許多專家相信,若能在
電玩虛擬領域成功,可藉此發展出演算法,最終促成自動化系統問世,解決現實世界問題
。
人工智慧已證明可在「一對一」回合制遊戲中主宰人類。如二○一七年,「DeepMind」研
發的人工智慧「AlphaGo」,戰勝世界第一的中國圍棋冠軍柯潔。然而,在需要團隊合作
及複雜環境互動的「多人玩家」遊戲中,人工智慧要擊敗人類,仍屬不可踰越的任務,因
為此類遊戲需要隊友間的協調。為此,「DeepMind」以「雷神之鎚III競技場」為研究目
標。該遊戲規則是,兩個團隊要保護自身旗幟,奪取對手旗幟,遊戲要求玩家與隊員合作
,在不斷變化的地圖中與對手競爭,採取混合侵略及防守的複雜策略。
程式設計師依靠名為「強化學習」(Reinforcement Learning)的數學技術,使其研發的
代理人透過反覆試驗來自我學習任務。實驗結果顯示,在給予代理人時間自我訓練後,能
力足以與專業遊戲測試人員相提並論。經十二個小時練習後,在與代理人對戰時,人類測
試員的勝率只有廿五%。之後,研究人員調低代理人的瞄準能力,將其反應速度調降至人
類水平,但其勝率仍優於人類。
------------------------------------------------------------------------------
最近 Quake 2/3 相繼都有相關新聞,Quake 2是經典老遊戲新面貌挑戰現階段顯示卡效能
極限。
#1SxYwZRz
Quake 3 則是 AI 在 CTF 搶贏人類玩家,期待哪天AI+人一起同場競技....
--
Tags:
Steam
All Comments

By Ingrid
at 2019-06-03T20:08
at 2019-06-03T20:08

By Freda
at 2019-06-06T10:46
at 2019-06-06T10:46

By Oscar
at 2019-06-11T01:00
at 2019-06-11T01:00

By Audriana
at 2019-06-15T00:12
at 2019-06-15T00:12

By Candice
at 2019-06-16T00:07
at 2019-06-16T00:07

By Caitlin
at 2019-06-19T13:06
at 2019-06-19T13:06

By Frederic
at 2019-06-22T00:43
at 2019-06-22T00:43

By Harry
at 2019-06-26T23:02
at 2019-06-26T23:02

By Doris
at 2019-06-27T17:21
at 2019-06-27T17:21

By Belly
at 2019-06-29T12:58
at 2019-06-29T12:58

By Eden
at 2019-07-02T17:19
at 2019-07-02T17:19

By Rebecca
at 2019-07-06T08:06
at 2019-07-06T08:06

By Freda
at 2019-07-09T05:46
at 2019-07-09T05:46

By Hazel
at 2019-07-10T08:54
at 2019-07-10T08:54
Related Posts
那個天命奇御的劇情....

By Carolina Franco
at 2019-06-02T00:07
at 2019-06-02T00:07
Minecraft故事模式停止提供下載

By Delia
at 2019-06-01T23:47
at 2019-06-01T23:47
2D動作遊戲的極致!純白鋼鐵的X

By Kama
at 2019-06-01T23:32
at 2019-06-01T23:32
全軍三國 這版呂布是不是做壞了?

By Edward Lewis
at 2019-06-01T23:08
at 2019-06-01T23:08
Glorkian Warrior: The Trials Of Glork

By Donna
at 2019-06-01T22:22
at 2019-06-01T22:22