央視網 >數智頻道

大模型“玩”《黑神話：悟空》比人類強嗎

副標題：

來源：科技日報 | 2024-10-25 11:49:49

科技日報 | 2024-10-25 11:49:49

原標題：

正在加載

人工智慧大模型下圍棋已不是新鮮事，玩電腦游戲水平如何？不久前，淘天集團未來生活實驗室算法工程師，嘗試利用多模態大模型體驗國産電腦游戲《黑神話：悟空》，探索大模型在特定場景中的能力邊界，取得令人驚喜的效果。相關研究成果已上線論文預印本網站arXiv。

　　《黑神話：悟空》是典型的動作角色扮演類游戲。在當前大模型研究領域，有不少研究者選擇將該類游戲作為研究平臺，採用純視覺輸入、複雜動作輸出的模式，測試大模型在特定場景下的性能表現。其中，純視覺輸入是指模型僅通過理解和分析游戲截圖進行決策，而複雜動作輸出則需要模型生成並執行複雜而連續的動作，如戰鬥場景中的精確操作。

　　想要讓多模態大模型控制游戲角色，要克服兩大困難。一是直接視覺輸入的挑戰。由於大模型所需的環境數據不一定能通過游戲API（應用程序編程接口）獲取，因此對於那些需要深入理解游戲界面的大型游戲而言，學習從視覺輸入中進行推理是一種更直接的策略，這給大模型帶來不小挑戰。二是面向動作任務的困難。在動作類游戲中，基於強化學習的框架仍然佔主導地位，但在特定任務上需要大量訓練時間，遷移到其他任務上泛化能力較差，表現往往不佳。

　　為突破上述瓶頸，在此次研究中，技術團隊提出了一個名為VARP Agent（視覺動作角色扮演智慧體）的新框架。它直接以游戲截圖為輸入，通過一組多模態大模型的推理，最終生成可以直接操作游戲角色的代碼，每個動作都是由各種原子命令組合而成的序列。這些原子命令包括輕攻擊、躲避、重攻擊、恢復血量等。同時，該框架包含三個庫：情境庫、動作庫和人類引導庫。這些庫可以被檢索和更新，以存儲用於自我學習和人類指導的密集知識。

　　技術團隊定義了10個基本任務和2個挑戰任務，其中75%的任務發生在戰鬥場景中。對於戰鬥任務，如果玩家角色擊敗了敵人，則任務成功；如果玩家角色被敵人擊敗，則任務失敗。研究結果顯示，該框架在基本任務和簡單到中等難度的戰鬥中，勝率高達90%，但在面對高難度任務時，表現相對較差。總體來看，其整體水平仍不如高水平人類玩家，但研究成果可為設計應對更廣泛挑戰、更複雜的智慧體提供參考。

編輯：阮崢責任編輯：

點擊收起全文

返回央視網首頁返回數智頻道

掃一掃分享到微信

熱點推薦

加載更多

正在閱讀：大模型“玩”《黑神話：悟空》比人類強嗎

掃一掃分享到微信

手機看

掃一掃手機繼續看

A- A+

大模型“玩”《黑神話：悟空》 比人類強嗎

副標題：

原標題：

大模型“玩”《黑神話：悟空》比人類強嗎