《雲起·策問》聚焦數字與實體經濟創新實踐,講述光環背後的故事,記錄時代人物、傳播創新精神,致敬科學的力量。
無論對於科技界、經濟界乃至整個社會的發展,新的數字科技既是重大機遇,也意味著更大的挑戰。大模型(LLM),是通過大規模的數據、算法和計算能力訓練出的高精度深度學習模型。它能預測天氣,為消費者提供個性化選擇,輔助金融決策,幫程序員“寫代碼”......豐富的應用場景,將人工智慧賦能産業發展,造福百姓生活發揮得淋漓盡致。自2022年11月ChatGPT發佈以來,月活用戶突破億級,成為史上增長最快的消費者應用。
在上海市委市政府的支持下,徐匯區在2017年成為上海首個人工智慧發展集聚區,2019年入選全國首批戰略性新興産業集群並獲國務院表彰。目前,徐匯區集聚了上海人工智慧實驗室、期智研究院、三大國家級開放創新平臺等頂尖科研機構和企業創新平臺,創新高地初步成型;匯聚包括安謀、騰訊、商湯等領軍企業在內的近800家企業和機構,2022年總産近千億、近五年年均增長34.2%,産業規模穩步增長;形成“兩極兩帶”空間佈局,相繼打造西岸智塔、西岸數字谷、漕河涇元創未來、北楊人工智慧創新中心等標桿載體,連續6年承辦世界人工智慧大會,品牌影響顯著提升。
在大模型和生成式人工智慧領域,徐匯已匯聚了相關企業和機構近200家,包括互聯網大廠、AI企業、生態鏈場景公司等多元參與者。近期,首批根據《生成式人工智慧服務管理暫行辦法》通過大模型備案的8家機構企業中,徐匯區佔3家,分別為上海人工智慧實驗室(書生通用大模型體系)、商湯(日日新大模型體系)、MiniMax(ABAB大模型);兩批次《境內深度合成服務算法備案清單》中,上海共21個、其中徐匯區佔14個,産業集聚度、顯示度、影響力走在全國前列,為打造大模型和生成式人工智慧生態集聚區打下基礎。2023年9月28日,坐落于徐匯濱江的“模速空間”正式揭牌,是全國首個大模型專業孵化和加速載體,不僅推動大模型賦能千行百業,共同營造開放活躍的生態,也持續推動各類垂直場景小模型“首發首秀”。同時,徐匯區成功申報第三批全國知識産權運營服務體系建設重點城市項目,獲批全國首批國家知識産權強市建設試點城區,每萬人高價值發明專利擁有量、每萬戶市場主體的平均有效商標擁有量、商標集聚度、活躍度、“專精特新”企業戶均知識産權水平指數均位居全市首位。
其中,在徐匯區土生土長的星環科技是國內極少數掌握核心技術的公司,致力於打造“雲計算+大數據+數據庫+數據開發與智慧分析”的基礎平臺産品;而孵化于模速空間的無問芯穹則是由清華大學電子係師生創建的智慧科技公司,致力於提供行業最優的算力解決方案。
雖然國産大模型的正走向“用起來”的新階段,但在大模型結構本身的創新仍有不足,此外,算力的供不應求也限制了中小企業的成長。那麼我們該如何應對人工智慧給日常生活帶來的變革?對標國外大模型的發展,我國有怎樣的優勢與不足?大模型的應用落地有什麼好的實踐?對於國內算力供不應求的局面有什麼好的解決方案,未來又有怎樣的發展趨勢呢?
本期節目,李策走進模速空間,對話中國經濟體制改革研究會副會長 樊綱等,共話人工智慧時代的機遇和挑戰。
嘉賓簡介
樊綱:經濟學博士,中國經濟體制改革研究會副會長,中國(深圳)綜合開發研究院院長,北京大學匯豐商學院教授,中國社會科學院研究員,國家級有突出貢獻的中青年專家。
孫元浩:星環信息科技(上海)股份有限公司創始人、CEO,上海市信息化專家委員會大數據專業委員會委員,中國人工智慧産業發展聯盟理事。
夏立雪:無問芯穹智慧科技有限公司聯合創始人、CEO,入選AI2000人工智慧全球最具影響力學者榜單(芯片方向top100)以及斯坦福學科Top2% 科學家榜單。
以下為精選節目對話實錄:
樊綱:以知識産權為保障,擁抱AI時代新變化
李策:伴隨著數字經濟的發展,專利商標版權其實也很重要。知識産權在哪些方面可以支持以人工智慧為代表的數字經濟的發展?
樊綱:這不是哪些方面了。這是技術創新對經濟發展的重要作用。創新是由企業和個人把一些奇思怪想形成新技術的過程,而這個過程不是我們學者能事先知道的,它隨時可能出現,有時不是革命性的,有時是革命性的,有時改變了我們一個小的生産方式,有時改變我們大的生産系統。那麼在這個問題上,最重要的就是我們如何通過保護知識産權,鼓勵人們更多地去創新,使得發明家們能夠不斷涌現出新的技術。
過去因為落後,我們的發展著重發揮了後發優勢。那麼越往前走,我們逐步走到前沿了,也就是所謂的無人區,那麼就要靠自己創造了。但是我們由於過去一直在學習中,我們對於創造這件事兒,一方面我們還不習慣於自己創造,另一方面我們的制度也不是圍繞創造來設計的,包括大家的觀念也不是為了創造而設計的,於是大家不太重視知識産權,不重視版權等方面的保護。
那麼到了走到前沿的這一步,如何通過知識産權的保護,通過制度的保護,使得我們的企業和個人能夠有足夠的激勵去進行創造性的活動。以前我們主要在學習,今後我們主要要創新,因此這些制度上的問題都要跟上,以形成一種鼓勵企業和個人努力創造的氛圍與環境。
李策:我國在人工智慧方面,通過海量的數據和存儲,已經處於世界第一梯隊。在您的觀察裏,目前我國人工智慧的發展主要的突出成就在哪個方面?還有什麼樣的挑戰?
樊綱:方方面面都可能發生進一步的突破,包括我們的生活中越來越多用到AI,用到機器人。至於哪個領域具體有什麼突破,我不知道,我們不是做技術的,我們也不知道現在發展的一些前沿,但是你能看到方方面面都在發展。
我們有很好的例子,一個産業的一個新技術出現,會帶動一大批産業的出現,而且用途非常廣,不僅僅是在生産中,而且在生活中,具有非常廣闊的前景。
李策:有部分觀點認為,未來隨著人工智慧的發展,可能對於人類的工作崗位産生替代和擠出的效應,您認為人工智慧的發展會使失業率上升嗎?
樊綱:200年前開始這個問題就被提出來了,那時候機器替代人,後來任何一個自動化的發展,人們都在問這個問題。早年因為這個問題,很多地方出現砸機器的現象,因為工人把失業原因歸罪於人工智慧。
那麼現在當然人們會提出這個問題,但是你就想一想,人類社會總是不斷提出問題,解決問題。過去兩三百年來,隨著技術的發展,人們是怎麼解決這個問題的?
一個重要的方面是減少每個人的工作時間。從這個角度來看,機器實際上替代了人,把人解放出來,把人從一些繁冗的勞動中解放出來,創造了更多的休閒。
所以説如果問是不是人工智慧的發展導致人們的失業,我説人們首先創造了它們,帶給人們更多的閒暇。閒暇在經濟學當中是幸福的來源。實際上人類的幸福的增長,人類的發展過程,技術進步的發展過程,很大程度上解放了人類,使我們的工作時間減少,而有更多的時間享受生活。
這些新的技術的發展,真正的産生的結果是改變了人們的生活方式。人們閒暇的增長,一定會産生更多的與閒暇相關的新工作或新經濟部門,抑或使得部分原有部門加以擴大,如説旅遊、休閒健身等服務業。這類行業給予人們更多時間可以去追求藝術,去發展其他愛好,鍛鍊身體等,會有更多這些方面的職業被創造出來,所以我個人不是很悲觀。人類這幾百年來就是這麼過來的,這幾百年不僅工作沒少。從全球化的角度來説,越來越多的人被捲進了現代化,越來越多的人得到了就業,收入也是在增長,無論如何無論怎麼説,全世界這幾十億人生活水平也在不斷提高。
所以我不建議大家很悲觀地來看待這件事情,要看到它對人類的發展所做出的更深層次的貢獻,看到我們未來生活方式和生産方式的變化,用一種積極的觀點來看待我們的技術進步。
當然了這裡還要解決很多問題,這種調整過程這種變化過程可能是均衡或不均衡的,人們所享受到的調整成果也不盡相同,甚至有人反而“享受”了它的負面結果。所以這也需要一些社會政策來幫助大家轉型,幫助大家適應這種新的技術帶來的新變化。
孫元浩:輔助決策的大模型賦能千行百業
李策:我們都知道最近有一些熱詞,如人工智慧、區塊鏈、大數據、大模型、向量數據庫,對於普通受眾而言,我們如何能直觀地了解大模型呢?
孫元浩:谷歌在18年提出了大模型的架構,後來大家發現把這個模型的神經網絡(參數規模)變大,類似于模倣人腦,即大模型有類似人類神經元的參數。參數規模越大,相當於神經元越多。
大模型的一個優勢是能容納很多知識。我們可以通過訓練大模型,把過往的知識全部告訴它,它就能過目不忘,全部記在“腦子“裏,那就叫大模型訓練。
訓練完大模型後,針對已有的知識,它能夠像人一樣對答如流。這樣的大模型稱為大語言模型。
當然,現在大模型過渡到了多模態,也就是不局限于讀語言,還可以去看圖片、視頻等,這樣的大模型稱為多模態大模型。
李策:您認為在大模型這個領域可預見的未來裏,有什麼挑戰呢?
孫元浩:這個重要的挑戰就在於,我需要讓大模型學會行業知識。通用大模型目前已經達到一個大學本科生的水平了,但是本科生變成一個金融專家可能還需要十年。因而,怎麼把這個行業的知識整理好,並能運用到模型裏,解決行業的特定問題,是目前的一大挑戰。
李策:現在對比國外的話,我們國內的大模型處於什麼水平?還有多遠的差距?
孫元浩:我們國家今年差不多出現了大概上百個模型,現在更多的創新點集中在訓練的語料與訓練方法上,以及更重要的應用創新,即把大模型運用到各行各業。這些方面我國是有優勢的,發展比較快。
但是目前我們用的還是開源的網絡結構,在模型結構本身上的創新還比較少。因此現在欠缺的是在基礎理論的層次上,目前看來距離世界領先的大模型可能差至少一代以上。當然這樣的現狀可能還需要像模速空間這樣,聚集一大批大模型企業,研究大模型結構、訓練方法、應用場景等,需要大家共同努力。
李策:大模型在商業化層面有沒有一些很好的落地實踐?就今年而言有哪些新的突破?
孫元浩:現在大模型的基本用途,第一類就是構建各類的知識庫。比如企業內部的知識庫(規章制度、産品信息、産品維修等),此類落地場景稱為知識庫的場景。第二類場景,是目前在快速推進的數據分析大模型。用大模型增強大數據,讓用戶能通過自然語言獲得所需數據。
李策:對非專業人士而言,大模型是比較抽象的,但算法已經滲透到了我們生活的方方面面,如投資、炒股等,星環的産品在輔助決策方面有無比較突出的地方?
孫元浩:星環的産品主要針對數據分析軟體和大模型訓練工具。我們用大模型增強數據分析能力。現在在金融行業,目前用大數據和大模型的主要應用場景,是做客戶分析、事件分析。
如果需要了解有哪些主要的企業,每家企業的經營狀況怎樣,這些大模型能幫你去收集相關的信息,幫你整理出報告。它可能是投資研究報告,也可以不光是分析個別公司,它能分析全市場所有的金融情報,總結規律。比如,總結人工智慧板塊在過去一段時間表現如何,與二級市場行情是有什麼關聯度,總結出這樣的規律後,就把它作為素材,稱為因子,運用到後續的投資策略中,這一塊已經開始實踐了。目前有不少金融機構正在嘗試使用大模型做數據分析,以及金融情報分析。
夏立雪:致力於提升算力效率 連通國內算力生態鏈
李策:在2020年的時候,馬斯克説他預計在2025年人工智慧會超過人類,那麼通用式人工智慧的出現,已經使AI逐漸有了自主意識,那麼無問芯穹在這個方面有什麼樣的研究發現?在商業化落地轉化和應用層面有沒有新的突破呢?
夏立雪:現在其實我們看到ChatGPT在大家的工作生活中已經展現了自己的能力,但是現在距離真正能産生爆點的一些商業化産品還有一定的距離。在國內,有非常多的創業者和有想法有創造能力的人都在走向這樣一個方向。
但是我們現在也確實看到一個問題,就是在這個過程中,大家對於算力是有很高的需求的,而整體的算力在國內又是不足的,所以這就形成一個供不應求的一個市場關係。這對於好的創業者來説,他可能會有很好的想法,卻不一定有很強的資源和資金的能力,所以他們實際上是被排除在大模型場景孵化的門檻之外了。
無問芯穹在大模型孵化的階段更希望能夠通過自己的技術,讓國內很多沒有被用好和沒有被用起來的算力能夠發揮出價值,本質上其實是增大了整個國內在算力這邊的供應量,使得我們這些小玩家也能夠享受到廉價好用的算力,更專注在做自己的場景孵化工作,而非花精力去到市場上去想盡辦法採購算力。這是無問芯穹團隊在這個時間點想要為社會提供的價值。
李策:大模型號稱是能夠重塑千行百業,目前為人所熟知的有百川大模型、商湯的日日新大模型,還有書生通用大模型,那麼無問芯穹與這些大模型相比,差異性在哪?
夏立雪:從出發點來説,無問芯穹是希望算力的效率更高,這也是我們核心技術的體現。算力的效率實際上也就體現了,做一件事情到底需不需要這麼大的模型,本身也是一個算力效率的體現。
所以我們和這些通用基座大模型相比,會更關注行業,做一些模型的壓縮,提出一些針對行業的“中模型”,也就是説可能有很多企業都在去做通用的大模型,而我們是基於這些大模型往下去做不同行業的“中模型”,這會是我們不同的出發點。
李策:算力其實是人工智慧發展的重要支撐,那麼展望未來,這個領域的趨勢是怎樣的,又有什麼機遇和挑戰?
夏立雪:首先,算力這一部分,現在在國內還沒有被很好地發揮出來,但是我們有很多好的國産化的算力芯片並沒有被真正使用算力的客戶所接觸到。這裡主要是因為整個生態鏈還沒有打通,包括在算力上的軟體生態並沒有搭建起來,所以很多技術路線是非常分散的,那這樣的話就沒有辦法形成一種循序漸進的關係,這也進一步導致了整個國內算力稀缺的情況。
所以我們也是想從這個角度解決這個問題。因為我們自身非常擅長做軟體到硬體的聯合優化,推出了從模型到硬體的適配平臺,讓開發者不斷地關注底層的算力是什麼,同時對底層的好的芯片的提供方來説,也可以獲得真實的業務場景的反饋,不斷迭代優化自己的硬體和軟體設計。這個是我們現在看到的國內算力未來的發展趨勢,那時也會有很多好的國産化芯片有很好的産業前景。那在這個時間點,它更需要有一個人&&把中間的生態做起來。我們是希望能夠在這件事情,也為社會做一些貢獻。(推廣)(製片人:李策,統籌:湯艾一)