Seedance2.0之後,影像工業將何去何從?

來源:界面新聞 | 2026年02月13日 11:46
界面新聞 | 2026年02月13日 11:46
原標題:Seedance2.0之後,影像工業將何去何從?
正在加載


  2月12日凌晨,埃隆·馬斯克在社交平臺X上發表了一則簡短的推文:“It's happening fast”,而此前,在地球的另一端,《黑神話:悟空》的製作人馮驥也無心睡眠。他在推文中説:“AIGC的童年時代,結束了。”

  這場橫跨時區的共振,源於數天前的一次震蕩。2026年2月7日,字節跳動旗下的新一代AI視頻生成模型Seedance 2.0開啟內測。這款低調發佈的全新視頻生成模型展現出了極為穩定的運鏡效果以及可靠的多模態創作方式,引發社會高度關注。

  眼下正值冬奧會進行之際,在官方發佈的一條視頻當中,呈現了15秒的雙人冰上競技花滑片段,先後演繹了同步起跳、空中旋轉、精準落冰等一系列高難度動作。在複雜且連貫的運鏡之下,視頻成品自始至終保持着對現實物理運動規律的遵循,並未犯下此前AI影像中常見的物理謬誤。

  截圖自字節跳動官網

  這場“突進”在全球輿論場中引發了兩種截然不同的反應。一方面,許多創作者早已期盼著一款更穩健好用的視頻模型;而在另一邊,也引起了一場關於“原創”與“真實”的恐慌。面對爭議,Seedance團隊緊急回應,其正對部分問題進行進一步優化,並暫時叫停了真人素材參考。

  自2016年對抗神經網絡踏入視頻領域算起,視頻生成模型已迎來了屬於自己的第十個年頭,並終於行至更大規模商業化的前夜。倘若向前再踏一步,又將發生什麼?我們將迎來的到底是創作能力的平等賦權,亦或是人類靈性的損毀?而當全流程實拍已有可能變為一種小眾消費品時,我們應當感到輕盈,還是會陷入無可避免的失落?

  AI影像的十年跋涉

  1970年,媒體理論家吉恩·揚布拉德在其著作《擴展電影》中暢想了這樣一種未來:真正的未來影像,不應該再被膠片、銀幕與固定時長所束縛,而應當像生命一樣處在持續生成的“進行時”。這位理論家寫道,“當我們談論擴展電影時,我們其實是在談論擴展意識。”“擴展電影根本不是電影:它像生活一樣,是一個不斷成為的過程。”

  在揚布拉德的設想中,影像不再只是對現實的記錄,其終會走向對世界的模擬、重構與再發明;而觀眾也將不再在黑暗裏被動觀看,他們會走進影像,參與它、改變它,然後反過來被它所塑造。這既是某種想象,卻也像極了一則預言。環顧四週,此刻的人類正如揚布拉德所言,踏入了一個“人機共生”程度前所未有的時代,享受着技術為我們所搭建的新自然。而當我們的觀看列表裏充斥起越來越多的AI影像之後,這種感覺便會愈發強烈。

  我們究竟因何契機踏上了這條由揚布拉德所指明的路?畢竟,回望過去,視頻生成技術的發展歷程本非一片坦途。僅僅三年前,AI生産的內容大多依舊怪誕且“抽象”。彼時,一位Reddit用戶使用一款名為ModelScope Text-to-Video的擴散模型,在輸入提示詞“威爾·史密斯吃意大利面”後,生成了這樣一段視頻——畫面中,難以辨識的“威爾·史密斯”面對着蠕動的意大利面,其面部不斷變形,手指和叉子反復融合、麵條則時不時像觸手一樣鑽進耳朵。這部充滿“克蘇魯風格”的怪誕影像成為當時的人們質疑AI影像潛能的有力佐證。

  截圖自相關視頻

  以今天的眼光來看,這類視頻既反映了早期AI視頻生成算法的缺陷,也加劇着如今的我們遇見Seedance時的震撼與不安。

  把時間回撥到2016年,計算機領域的前沿學者們正興致勃勃地嘗試着一種名為對抗神經網絡的先進新算法,並將其用於圖片與視頻生成。那時,Carl Vondrick等人發表的論文《Generating Videos with Scene Dynamics》成為該領域的早期代表性工作之一。通過讓機器觀看大量無標注的視頻,他們試圖教會算法理解海浪如何翻滾、火車如何行進。剛開始,人們僅僅做到了“讓靜止的圖像動起來”。而後,新的範式不斷涌現,為AI視頻生成提供着更可控、更可用的新思路,但其仿佛離真正的“商業化可用”永遠間隔着一段難以逾越的距離。

  於是,雖然身處一個百花齊放的時代,但AI影像技術的發展勢頭並未真正引起影像産業的注意。起初,這種高度不成熟的算法只是停留在實驗室的電腦裏。而後,先鋒藝術家和短片藝術家們嘗試着接納了它們。相較而言,他們並不那麼在意這些模型所輸出的那些令人費解的錯誤,反而卻將“幻覺”以及偏離視作一種全新的藝術語言,並借此打造了一種以發散、開放為特徵且格外難懂的新風格。

  與這種難以捉摸的迷人實驗性相伴隨的,是早期模型裏難以根除的紊亂與不可控。每次使用算法生成視頻都宛如一場賭博,用戶無法知道下一秒蹦出來的會是驚喜還是驚嚇。威爾·史密斯吃意大利面的低保真視頻正是由此成為了一場全球範圍內的爆火迷因,人們興奮地挪用且分享它,並非是將其視為可用的素材;相反,面對這種“難繃”的故障和崩壞,低能的AI成為了那個可以隨意揶揄嘲諷的“人工智障”。

  2023年,AI視頻終於踉踉蹌蹌迎來了自己的産品化紀元,但其使用者們或多或少依舊置身於一種“高科技默片時代”。音畫不同步是彼時一項難以逾越的技術難題,與此同時,早期模型的不可控性雖減輕了許多,但差錯依舊時不時蹦出來,並隨即徑直打破觀看者的第四面墻。隨着技術的發展與成熟,AI生成的威爾·史密斯似乎慢慢學會了如何正確地使用叉子,但他偶爾還是會在進食中途把麵條吸入鼻孔,或者在咀嚼時下巴突然融化。

  回顧這段曲折的道路,我們不難醒悟,為何今日自己點開熱搜會如此驚訝。當我們打開視頻網站,觀看Seedance 2.0及其作品時,發覺這款模型已在不知不覺中翻越了重重高山,而AI影像也正緩緩告別着其“默片時代”,大步走向着屬於自己的有聲電影紀元。

  AI影像正緩緩告別着其“默片時代”(圖源:pixels)

  長期以來,AI視頻最大的違和感來源於“音畫割裂”。角色説話時嘴唇的開闔往往與發音脫節,在觀看者看來,這些如同拙劣的譯製片或腹語表演的瑕疵效果往往難以忍受。Seedance 2.0在底層模型上實現了音頻與視頻的聯合生成。它能夠根據具體場景生成匹配的音效和配樂,也實現了幀級精度的口型同步與情緒匹配。這種多模態的協同,讓AI角色第一次産生了類似於“演技”的觀感。

  而在聲音之外,Seedance 2.0還呈現出了對鏡頭語言的驚人掌控能力。它內置着導演級的運鏡邏輯,不再需要人類手動拆解每一個機位。此外,其還能夠根據故事情節自動規劃分鏡。相比之下,在過去的AI工具中,指揮模型進行複雜的運鏡往往是一項艱難的挑戰。即便使用者具備相關知識,並精確地使用了“鏡頭左移”“推軌”“希區柯克變焦”等複雜的提示詞,模型也無法確保提供穩定且可用的畫面。

  當AI開始學會用鏡頭講故事,其也意味着影視製作中難度頗高的“調度”與“運鏡”逐漸被封裝進算法當中。如果僅從效率主義的視角來看,這一次迭代,毋庸置疑是一場屬於技術的勝利。

  然而,效率之外呢?

  影像産業將何去何從?

  倘若我們僅僅將Seedance 2.0以及與之類似的工具視為純粹的效率工具,則很有可能嚴重低估其真正蘊含的能量。譬如説,面對來勢洶洶的 Seedance2.0 們,傳統影像工業體系還經得住嗎?

  縱觀曾獨屬於人類的百年電影史,正是人類創作者的精心操作,造就了那些迥異的影像風格。一部影片得以完成,必然依賴於攝影機對物理世界的捕捉,也往往依賴於布光、走位、實景搭建以及隨後漫長的剪輯和拼接。而此刻,這一切繁複但可為人類所理解的生産流程,卻正被AI以一種黑箱式的一次性生成所替代。那座曾經龐大、精密的電影工業金字塔,或許正面臨着顛覆的風險。

  好萊塢(圖片來源:pixels)

  事實上,風險並非始於今日。在Seedance 2.0引發海嘯之前,以漫劇為首的商業形態已率先成為巨頭們測試AI成色的搶灘陣地。

  2026年2月4日,騰訊在各大應用商店低調上線了其首款獨立漫劇App——“火龍漫劇”。這款由深圳騰訊計算機系統有限公司直接開發的試水産品,其動作之迅猛卻絲毫不見“嘗試”的猶豫。同日,中文在線發佈公告,確認與騰訊達成高達2320萬元的漫劇授權合作。

  騰訊的這次嘗試並非孤例。觀察業界動態便不難察覺,這似乎是一場蓄謀已久的圍獵。截至目前,字節跳動旗下的紅果短劇早已將漫劇作為核心板塊,百度推出了“柚漫劇”,快手、B站、愛優騰芒等長視頻巨頭也紛紛下場。它們或舉辦AI創作大賽, 或直接成立漫劇頻道。

  如今,AI漫劇賽道的跑通,已充分驗證了一條全新工業流水線的可行性。在這裡,編劇取代了導演,而提示詞則取代了攝影機。曾經需要多人分工合作且耗時數周的漫劇製作,正蛻變成一種低成本的自動化競速游戲。另一方面,當今時代內容生産過剩,觀眾的注意力成了稀缺資源,對於早已陷入零和博弈的內容市場而言,AI入局也可能會引發更慘烈的擠出效應。

  1月,瞭望財經與快思慢想研究院就國內AI視頻生成産品現狀及發展趨勢,發佈了《2026年國産AI視頻生成領軍産品競爭力報告》。該報告顯示,當前AI視頻營銷項目平均投資回報率達到1:5.7,AI視頻廣告、AI漫劇、AI網劇已成為愛優騰等傳統視頻平臺、紅果等網劇平臺的熱門生産模式。在運用形式上,高端製作團隊多采用“虛擬拍攝+AIGV”模式,小型製作團隊主要採用純AIGV方式生産短視頻商業作品。2026年,AIGV網劇單集視頻製作成本將只有人工拍攝的約1/10。

  就在不久前,頭部AIGC創作平臺“巨日祿”的CEO斯宇也曾對媒體拋出一份數據:通過他們的一站式AI創作平臺,一部精品真人AI劇的製作成本已被壓縮至約1000元/分鐘。而這是在Seedance 2.0發佈之前的數字。隨着Seedance 2.0帶來的“原生多鏡頭敘事”與“零後期”能力的普及,AI生成的成本優勢或將被進一步拉大。或許在未來,全流程的“真實”將變為一種昂貴的奢侈品。那些純粹的實拍、精湛的人工製作,則如同手工機械錶一樣,退守為一種極少數人從事的小眾藝術。

  相較於AI影像,全流程人工拍攝往往更為昂貴(圖源:pixels)

  從業人數萎縮的同時,相關崗位也不免同步縮減。其實早在兩年前,崗位危機便已初現端倪。2024年2月,美國電影大亨泰勒·派瑞(Tyler Perry)在目睹了Sora的演示後,無限期擱置了他位於亞特蘭大、總投資高達8億美元的攝影棚擴建計劃。他在接受《好萊塢報道》採訪時,直言不諱地將許多影視相關崗位列入了高危名單:“很多人或將失去工作……這讓我非常震驚。”

  2024年6月,北美影視工會(IATSE)經過與好萊塢製片廠的艱難談判終於爭取到了所謂的“AI保護條款”。但在技術迭代的巨輪面前,紙面上的協議往往更加滯後,顯得蒼白無力。

  而Seedance 2.0及同類産品的問世,於傳統影像工作流中的多個崗位無異於又一次沉重打擊。譬如就剪輯師而言,此前同類AI産品生成視頻的過程看似自動,其實依舊需要剪輯師進行大量的拼接、修補及其他後期工作。然而,Seedance 2.0能根據單一指令,自動生成包含運鏡、轉場的整段視頻。傳統剪輯師賴以生存的“蒙太奇”技藝正被算法內化為其生成過程的一部分,其自身也可能會進一步淪為算法表演的旁觀者。

  在不知疲倦的算力中心外,一個純粹的人類影像製作時代,或許真的正在遠去。

  救贖之光,抑或是即將消散的“靈光”?

  1934年4月27日,本雅明站在巴黎的講壇上,發表了題為《作為生産者的作者》的演講。在這篇經典文本中,本雅明勾勒出了一種頗為激進的藝術功能觀:藝術的政治使命不在於悲憫地俯瞰大眾,而在於改造生産工具,將原本被動、沉默的消費者,轉化為具備主體意識的參與者、創作者。

  他援引了當時前蘇聯報紙的轉型作為佐證。在本雅明的觀察中,讀者的書寫能力不再受困於精英階層的專門教育,而是化作一種公共財産。當“作者”與“公眾”的界限開始消融,文學能力的特權得以松動,每一位讀者都隨時準備着跨越那道隱形的門檻,成為創作者。

  在媒介演變史上,報紙曾重塑內容創作與消費的關係(圖源:pixels)

  跨越近百年的時光,在愈演愈烈的AI視頻浪潮中,這種“技術民主化”的宏大敘事話語似乎再次找到了回聲。

  當Seedance 2.0這版強悍且觸手可及的視頻生成模型問世,社會上涌出這樣一種論調:技術正在為那些原本缺少資源的“普通創作者”們賦權。這或許正是本雅明所呼籲、卻在此前從未真正降臨的那道“救贖之光”。儘管在算法的侵蝕下,某種獨屬於人類情感的、難以名狀的“靈光”似乎正加速消散,但創作的權利卻在驟然間被前所未有地平等化了。那些曾被表達門檻、資金匱乏或技術壁壘勸退的“普通人”,仿佛第一次握住了打開創作之門的鑰匙。

  從數據上看,這種轉變在很大程度上並非幻覺。根據B站2025年第三季度財報,每月有近10萬AI相關UP主活躍在平臺上,AI內容日均投稿量同比增長83%,播放時長增長近50%。而《中國網絡視聽發展研究報告(2025)》的數據則更為直觀:在10.91億網絡視聽用戶中,近1/3的網民已經開始嘗試使用AI製作圖片或視頻。

  於是,此刻的我們正見證着這樣一種現實:AI應用的全面鋪開真的幫助着一部分個體實現了由消費者轉向創作者的身份躍遷。在這一過程裏,技術所扮演的角色則宛如賽博朋克設定集裏的“義肢”,它們原不是身體的一部分,卻又在很大程度上構成了自我行動能力的外延。譬如,社恐的創作者可以通過AI聲線規避聲音羞澀,而缺乏預算的想象力天才則無需實拍,僅憑提示詞即可構建宏大的史詩畫面。

  然而,當生産力的閘門被暴力推開,隨之而來的並非全然是創作的樂土。對於影像産業之中的人們而言,生産流程的嬗變、分工模式的瓦解以及版權歸屬的亂局已是肉眼可觀的挑戰。但在這之外,我們是否低估了其他一些更為隱秘且沉重的代價?

  首當其衝的,是個體生物信息的“失守”。

  面對驟然問世的 Seedance 2.0,知名博主、影視颶風創始人Tim(潘天鴻)發佈了一條實測視頻。在視頻當中,他並未吝嗇對這款“改變視頻行業”模型的讚美,無論是生成畫面的精細度、複雜的運鏡邏輯,還是分鏡的連續性與音畫匹配,Seedance 2.0都展現出了某種令人戰栗的統治力。

  不過,Tim也謹慎地在視頻最後分享了另一個細節:“在沒有給任何提示,任何詞語,任何信息的情況下,我也沒有給我的聲音文件,只是把我的臉傳上去,這個AI居然知道這張臉的聲音。”

  截圖自影視颶風

  在這種“精確匹配”的背後,隱藏着算法對個體數字主權近乎掠奪式的越界。其早已超出了簡單的模倣,更近乎於一種基於大數據的“推理”與“補全”。肖像權的概念在算法的凝視下正變得支離破碎,在未來的數字世界當中,挪用一個人的身份信息或許不再需要複雜的黑客技術,只需要一張照片,AI便可完成。

  而在個體信息的挪用外,對於造假的討論也再度回溫。當下,造假的門檻與代價不斷被拉低,辨別真偽的能力卻成為了罕見的特權。在這一過程當中,AI技術的進步所扮演的角色則頗為曖昧:一方面,更好的技術有能力成為人類辨別謊言的“照妖鏡”。許多科技企業在自己的算法深處埋下了難以去除的簽名系統,從而可為其所生成的內容加注數字水印或影像元數據。此外,諸如深偽檢測模型(Deepfake Detection)等獨立檢測工具也在不斷更迭,試圖與造假者進行一場永無止境的軍備競賽。

  但在另一方面,這種貓鼠游戲正變得越來越令普通人感到力不從心。技術的發展不可避免地催生出人眼甚至專業軟體都難以辨別的AI生成品。隨着視頻生成技術越來越擅長還原物理世界的光影折射與肌肉顫動,對“真實”的確認正變成需要經由昂貴技術認證才能獲得的“特權”。如今,對於絕大多數個體而言,我們或許已一步步失去那種“親眼所見即為真”的安全感。

  最後,在這些顯性社會風險之外,當我們重新回望創作本身,一處潛藏在創作基座下的危機也正悄然浮現:AI視頻的底層原理,本質上是對人類既有素材的暴力式拆解、學習,以及對現成風格碎片的挪用與縫合。如果一種“創新”的底層原理依舊是極其高明的“重復”,那麼,人類創作的未來究竟在哪?“原創性”又將何去何從呢?

  在《我生命中的幽靈:關於抑鬱、幽靈學和失落未來的寫作》一書中,馬克·費舍爾提出一則斷言:“未來”作為一種能夠帶來根本性變革和異質性的力量,已經從我們的文化地平線上消失了。費舍爾認為,現代文化已經進入了一種“幽靈學”狀態:我們被困在了一個只有“永恒的現在”和“不斷的懷舊”的時間循環裏。21世紀的文化不再産生真正的衝擊力,它只是在用數字技術不斷翻新20世紀的殘影。

  我們驚嘆於Seedance 2.0的迅捷,並感慨其能夠在剎那之間,生成一段“直接電影式”或“賽博朋克風”的視頻。但此刻的我們是否正如費舍爾所言,親手加速或見證着未來的終結?當所有可能的組合都已被算法預演,那道本雅明所期待的、通往解放的救贖之光,最終還能否如其期待般照亮未來?我們又是否已然踏進了一片巨大、靜止且不斷自我重復的數字荒原?

  前方是樂園還是迷宮,我們尚不得而知。但在未來真正到來前的此刻,或許,我們依然持有選擇的權力:並非無條件接納技術所給予的一切,也並非全然選擇恐懼與排斥,而是與技術建立理解與對話,並在守護人類權利底線的前提下,審慎地尋找出口。

編輯:張雷 責任編輯:焦健
點擊收起全文
掃一掃 分享到微信
|
返回頂部
更多精彩
正在閱讀:Seedance2.0之後,影像工業將何去何從?
掃一掃 分享到微信
手機看
掃一掃 手機繼續看
A- A+