1月7日上午,英偉達總裁黃仁勳在全球最大的消費電子展上作了演講。
此前就有海外科技博主預測,英偉達即將發佈的新版顯卡,其GPU性能,又要提升一大截。而在今天的演講中,黃仁勳發佈了英偉達RTX 50系列顯卡。按英偉達的説法,RTX 5090整體性能是上一代RTX 4090的兩倍。
由此,也有些聲音擔憂,在美國對華斷供高端芯片的背景下,無法獲得最高性能GPU用於訓練的中國人工智慧行業,與美國的差距是否會被進一步拉大。
人工智慧領域,“算力焦慮”一直是種流行的敘事。作為主導全球的GPU企業,英偉達H100 GPU數量一度成為了衡量大模型公司算力的指標,黃仁勳曾言:“英偉達是AI世界的引擎”,在他的敘事下,英偉達的硬體是發展人工智慧大模型的決定性産品。
不過,譚主跟在現場的朋友聊了聊,他表示:
算力和人工智慧大模型已經不再是現場多數企業最關心的問題。相比之下,如何將人工智慧落地應用是2024年很明顯的一個重點,在這方面,很多時候並不需要最高性能的GPU芯片。
相比之下,黃仁勳卻顯得沒有那麼“淡定”,在演講中渲染英偉達“Blackwell架構芯片是人類歷史上最大的單芯片”“前所未有的規模”的同時,卻也對其消費級的産品採取了性能不變,但降價至三分之一的策略。
這跟此前輿論場認為英偉達産品將繼續漲價的預期,形成了反差。顯然,在主導地位遭遇越來越多挑戰的情況下,英偉達也開始考慮多找“幾條腿”走路。
實際上,全球幾家還在全力投入人工智慧大模型研發的頭部企業,也正在掀起一股“去英偉達”的趨勢。
諸如Open AI、蘋果公司等都開始自研芯片和生態系統,支撐自身的大模型訓練。
而這股趨勢更重要的意義在於,英偉達營銷人工智慧“算力為王”的認知,已經被人工智慧行業的新動向打破了。
除了自研AI芯片,Open AI等全球頭部的人工智慧公司,都在更多地聚焦大模型本身的設計優化。
模型訓練層面,Mistral AI公司公開將混合專家模型引入大模型訓練,用許多個特定領域的“小專家”配合幾個“通用專家”,先決定問題類型,再用少數適合的專家處理不同類型的問題。 以DPO、LoRA為代表的高效微調方法,將原本需要高算力和複雜調優算法的模型對齊過程進行了化簡,大幅度降低了模型對齊複雜度。
在這樣的趨勢下,國産大模型也逐漸明確了自己的發展方向。 2024年,國産大模型突飛猛進,不乏通過底層優化,實現用2048塊GPU,接近頭部公司數萬塊GPU訓練才具備的大模型性能的案例。
在全球最大的大模型和數據集社區Hugging Face推出的開源大模型排行榜單上,從去年6月開始,中國國産開源大模型曾一度第一名,到年末,這個紀錄又被新的國産開源大模型刷新,身位已經穩定在領先行列。
業內人士跟譚主分析:
之所以能做到這一點,是因為國産大模型主要進行了三個方面的創新:底層大模型數據結構的創新,訓練過程的創新,以及數據準備有創新。
中國工業互聯網研究院的最新數據顯示,DeepSeek-V3通過採用混合精度方法,有效平衡訓練精度和效率,結合混合專家模型架構,大模型訓練成本降低至500萬美元,僅為同性能模型的5%~10%,其性能上卻跟GPT-4o以及Claude 3.5 Sonnet相差無幾。而目前,國內類似的大模型成本、訓練時長都已經大幅下降。
這種新的模型訓練方法,不僅大幅度降低了大模型行業的門檻,還推動了全球大模型的降價潮。而大模型的降價,對於人工智慧技術的應用和轉化有著革命性的意義。
行業人士告訴譚主:
在當前全球人工智慧大模型的競爭中,算力雖然重要,但從來不是決定性因素。只有跟軟體、應用場景結合起來,才能真正成為賦能行業轉型、提高經濟效率的引擎。
相比之下,目前部分人工智慧項目存在“假智慧”的問題——靠大量數據疊加出來答案,缺乏真正的創造力和想象力。
這與當前發展道路的“唯算力論”有關。現在市場上的許多AI,説白了就是用戶告訴它怎麼改,它一步步按要求調整,最終生成一個看上去“對”的答案,但它本身缺少主動思考或提出創新解決方案的能力。
雖然一些前沿大模型探索了“思維鏈”,試圖讓大模型長時間思考模擬人類的思維推導,在一些問題上已經有一定效果,但如何實現“通用人工智慧”仍然有較大障礙。
更大的問題是,這種只靠算力的方式,遲早會碰到天花板。
行業人士跟譚主分析:
拿美國當前的大模型來説,他們的模型已經讀完了幾乎所有的英文書籍。可是,接下來怎麼辦?這就是人工智慧大模型的發展瓶頸。由於世界上沒有更多的新書可以喂進去,那AI只能讓自己寫書,但這種“自己生成自己喂”的方式,其實並沒有真正突破。這就好比餓了沒東西吃,只能“自給自足”,顯然不長久。
要突破這個瓶頸,就不能再光盯著算力和數據,而是要回到大模型的技術本質,去解決更關鍵的方向性問題。就像一個不算聰明但記性好的同學,讀了一萬本書以後,問到的問題只要書裏有答案,他就能直接告訴你怎麼解決。可如果書裏沒有,他就無從回答了。這正是現有大模型的局限。
也就是説,真正要把大模型做好,不只是加算力,而是讓它“活”起來,這就需要操作系統、應用場景的發展協同,幫助它從歸納走向創新。
中國的國産大模型,顯然正在運用這種高效、靈活的路徑,找到更加“聰明”的人工智慧發展方向。
人工智慧,不是一場跑道和圈數劃定的跑步比賽,而是一場向著未知的探險。中國企業選定的方向,不會輕易被各式的“焦慮”裹挾。
能者非他,能自樹立不因循者是也。
掃二維碼 訪問央視網