據《自然·通訊》28日發表的一篇論文,谷歌“深度思維”報道了一個人工智慧(AI)體,在3D模擬中,該智慧體能在第一次見到的任務中極迅速地模倣人類專家,實時可靠地獲取來自人類搭檔的知識。這一研究結果是對AI實現快速知識傳播的一次概念驗證,也是朝著人類—AI開放式互動的文化演變邁出的第一步。
具身AI,是指有身體並支持物理交互的智慧體。之前在物理模擬和現實世界中,科學家已經證明了可用人類數據讓具身AI學習新技能。但過去的智慧體通常需要在監督下從大量第一人稱的人類演示中學習,這類獲取既昂貴又費時。相比之下,人類本身則可以通過模倣示範者,在幾秒內以互動方式學會新技能,即使初生嬰兒也有這種能力。因此,科學界一直在尋求一種AI智慧體,能從效率和隱私與人類相倣的其他個體那裏進行社會化學習。
“深度思維”團隊此次利用深度強化學習訓練了一個智慧體,這個智慧體能在名為GoalCycle3D的物理模擬任務空間裏,幾分鐘就發現並模倣專家的行為,同時記住所學知識。訓練後,他們發現這個智慧體可在各種有挑戰性的導航問題中從普通人類和AI專家那裏快速學習,雖然它們以前從來沒見過人類。
比如,這個智慧體可在包含大量障礙的複雜地形中穿梭。該方法的一個關鍵是一種新形式的自動化課程,該課程結合了示範者的階段性遮蔽以及任務難度的逐步升級。而這個智慧體的個體神經元在其中能同時編碼物理信息和社會信息。
新研究結果為AI領域和文化演化心理學之間的密切互動奠定了基礎。團隊認為,AI從業者可從人類社會學習中汲取靈感,構建出適應“人類夥伴”這一角色的具身智慧體,並保護好隱私。此外,能通過社會學習的AI智慧體,或為研究人類文化發展提供新的建模工具。
模倣,是嬰兒都具有的能力。他們能模倣大人的表情、語音語調、行走方式,在這一點上,需要被投餵大量訓練數據的人工智慧確實“相形見絀”。“深度思維”團隊一直致力於人工智慧的研究,他們開發出了多模態、多任務的智慧體。如今,“深度思維”的智慧體可以迅速識別和模倣人類專家行為,還能夠編碼物理信息和社會信息。這一研究再次提示我們,未來是人機共存的社會,人類和機器的交互,將改變機器學習,也改變人類自身。