機器人或成人工智慧領域“弄潮兒”

副標題:

來源:科技日報 | 2024-06-05 10:14:48
科技日報 | 2024-06-05 10:14:48
原標題:
正在加載

當看到提示“挑選滅絕動物”時,谷歌的RT-2選擇了恐龍雕像。
圖片來源:谷歌“深度思維”公司

人形機器人使用OpenAI編程獲得語言和視覺。圖片來源:《自然》網站

觀看《星球大戰》長大的一代人可能會感到失望,他們目光所及之處,仍看不到C-3PO類機器人的影子。那些預想中具有常識、能在家裏和職場為人類提供幫助的人形機器人何時會出現?

人工智慧(AI)的快速發展或許很快會填補這一空白。

《自然》網站近日報道指出,AI和機器人技術“聯姻”,可能是一場將彼此推向新高度的“雙向奔赴”。AI給機器人灌輸常識,讓其能像人一樣處理各種任務;機器人則利用身體經驗,幫助AI躍升為“通用AI”。但專家提醒,這條雙向奔赴之路仍面臨諸多挑戰,包括收集海量精準數據供機器人學習、應對“喜怒無常”的硬體、解決安全問題等。

基礎模型助機器人“更聰明”

眾多機器人領域的AI科學家都希望,未來機器人能在更廣泛環境中自主適應。例如,會幫顧客挑選産品的機械臂,能陪伴老人的智慧人形機器人等。

然而,控制這類機器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力於將多功能學習算法(基礎模型)嵌入機器人,以便其在聊天時表現得更像人類。這些想法的核心是給機器人灌輸常識,使之能勝任各種任務。英偉達公司機器人技術營銷專家傑拉德·安德魯斯強調,機器人技術目前正處於變革的關鍵時刻。該公司于3月推出了一款專為人形機器人設計的通用AI模型。谷歌“深度思維”公司則創建了現有最先進的機器人基礎模型之一RT-2,其可以認出明星的照片,儘管之前受到的訓練中該明星並未出現過。

研究人員樂觀地認為,基礎模型有助科學家研發出可以輔助人類勞動的通用機器人。今年2月,人形機器人公司籌集6.75億美元,以在通用人形機器人中應用OpenAI開發的語言和視覺模型。一段視頻顯示,機器人給人一個蘋果,以回應人們“吃東西”的要求。

多樣數據讓機器人“更有經驗”

儘管聊天機器人正在接受來自互聯網數十億單詞訓練,但機器人活動的數據集還遠遠不夠。

數據匯集或是一種解決方法。美國斯坦福大學機器人研究專家亞歷山大·卡哈扎特斯基及其同事創建了開源數據集DROID2,匯集了德國Franka Robotics公司製造的Franka Panda 7DoF機械臂約350小時的視頻數據,包括浴室、洗衣房、臥室等數百種環境的記錄。這種多樣性有助機器人在全新環境下更好地執行任務。

加州AI公司Covariant也在努力擴大機器人數據的規模。該公司于2018年開始從世界各地的30種機械臂中收集數據,其“機器人基礎模型1”(RFM-1)不僅收集視頻數據,還收集傳感器讀數。此類數據對於提升機器人任務執行能力至關重要,比如讓機器人知道如何不碰傷香蕉。

此外,許多專家正致力於構建3D虛擬現實環境,旨在通過這些環境來訓練機器人。元宇宙平臺(Meta)和英偉達都在模擬領域投入大量資源,以擴大機器人數據的規模,並建立了複雜的模擬世界。通過這些平臺,機器人能夠在短短幾個小時內積累相當於多年實際經驗的數據。

硬體和安全問題需考慮

許多機器人專家指出,儘管AI給了機器人更智慧的“大腦”,但其進一步發展仍面臨諸多挑戰。機器人很複雜,而且硬體很容易損壞。

新加坡國立大學人機交互專家哈羅德·索赫説,機器人可能需要大量其他類型的數據,如觸覺或本體感覺(身體在空間中的位置感)數據。這類數據集目前還不存在,但這是人形機器人高效工作所必需。

安全性必須認真考量。大型語言模型已被證明會産生錯誤、偏見,也可能誘騙人類或機器人做一些“壞事”。鋻於此,研發人員需要給機器人AI模型中植入一些規則。機器人無疑仍需要大量人工監督。

儘管存在一定風險,但AI與機器人的這場雙向奔赴仍值得期待。而AI通過與機器人相結合,增加與現實世界互動,有望超越學習模式做出預測,真正理解和推理世界。

編輯:阮崢 責任編輯:
點擊收起全文
掃一掃 分享到微信
|
熱點推薦
正在閱讀:機器人或成人工智慧領域“弄潮兒”
掃一掃 分享到微信
手機看
掃一掃 手機繼續看
A- A+