近日,美國人工智慧研究公司OpenAI推出了一款視頻生成模型“Sora”。
OpenAI的官網介紹稱,使用這款模型可以用文本生成長達一分鐘的視頻,視頻可具有多個角色、特定類型的運動、精確主題和背景細節等複雜場景。
該公司稱,開發這一模型旨在教會人工智慧理解和模擬運動中的物理世界,並訓練其幫助人們解決需要現實世界互動的問題。
美國有線電視新聞網(CNN)援引市場研究公司ABIresearch的高級分析師海登的話報道稱,“Sora”可能會對數字娛樂市場産生重大影響,因為新的個性化內容將在各個渠道上傳播。
在針對“Sora”的介紹中,OpenAI還指出,當前的模式存在弱點,可能難以準確地模擬複雜場景的物理表現,也可能無法理解因果關係的具體實例,並舉例稱,視頻很可能會出現一個人咬了一口餅乾後,餅乾上沒有咬痕。
同時,該模型還可能混淆諸如左和右這類的空間細節。
OpenAI表示,計劃與專家團隊合作測試最新模型,並密切關注包括錯誤信息、仇恨內容和偏見在內的各個領域。