賽題報名及詳細信息詳見《首屆全國先進計算技術創新大賽》官網
生態構建專題賽共設三道賽題,分別為“ARM服務器的內存RAS設計”、“基於AI算法的Linux平臺應用UI自動化識別與測試”和“基於計算硬體平臺的AI大模型遷移”。
一、2023D1-ARM服務器的內存RAS設計
賽題説明
1、賽題背景
目前ARM計算平臺在生態適配性上仍與X86計算平臺存在較大差距,尤其在可靠性適配方面,即RAS特性還沒有系統性的實現,這導致了ARM計算平臺在進入金融市場存在可靠性不足的問題。
基於ARM平臺如何提昇平臺可靠性,構建對內存故障、CPU故障、總線故障的檢測方法和容錯能力,是提升ARM平臺可用性的一個關鍵問題。
2、賽題任務
基於ARM平臺為基礎,重點針對內存故障檢測和容錯問題進行研究,給出解決措施;需要基於ARM框架進行故障檢測方式分析,並考慮如何通過OS進行故障內存在線隔離,形成完整的方案,並通過在飛騰S2500 ARM平臺上進行模擬實現頁面隔離(會提供內存的地址,供模擬隔離)。
圖1:基於硬體錯誤的linux內核的隔離策略
參賽隊伍需基於ARM平臺,針對內存可糾正錯誤實現故障檢測和容錯設計和驗證,給出判定內存頁面故障的方法(本題針對內存可糾正錯誤),並通過基於ARM的RAS架構分析,輸出故障上報和容錯的方案,包括相關的模塊以及模塊的功能和處理流程。並最終在設備上模擬驗證部分流程是否符合預期。
專題賽階段:
參賽隊伍在初賽階段需完成方案設計,包括內存可糾正錯誤的檢測方法和容錯總體框架,結合方案並基於linux系統,給出對應接口及其實現詳細機理;輸出方案設計文檔及重點技術的機理描述,在線提交。復賽階段,參賽團隊需要基於初賽的設計方案參與現場答辯,通過答辯考察方案及重點環節的掌握程度,例如檢測算法或頁面隔離等技術等。
總決賽階段:
參賽團隊需在主辦方提供的雲服務器上,完成模擬內存故障(主辦方會提供基於飛騰S2500處理器或X86服務器的待隔離內存地址,針對該地址進行隔離即可,即無需實現故障檢測,只實現隔離模擬即可)頁面在線隔離,需要基於OS對ARM平臺的流程來實現,進而模擬實現ARM平台下的內存頁面在線隔離展示,並通過ppt進行現場答辯。
3、賽程賽制
專題賽分為線上初賽和線下復賽兩個階段:
(一)線上初賽:參賽隊伍線上提交作品。大賽專家組依據參賽隊伍進行線上評分,選取優秀者進入線下復賽。
(二)線下復賽:在專題賽主辦地舉辦。通過現場答辯,角逐出優勝獎入圍總決賽。
總決賽:在四川省達州市舉辦。通過現場答辯,評選出一、二、三等獎。
4、賽題技術支持
參賽環境:參賽隊伍可申請使用由中國電子云計算平臺提供的算力資源。
二、2023D2-基於AI算法的Linux平臺應用UI自動化識別與測試
賽題説明
1、賽題背景
2020年底麒麟生態軟硬體適配量已突破150萬項,但和國際頭部操作系統相比還有較大差距。軟硬體生態適配體量大,類型複雜多樣、産品迭代速度快等問題給適配測試工作帶來巨大挑戰,用戶真實場景難以全覆蓋、回歸測試人工成本高,迫切需要一個高效智慧的自動化測試方案來保障生態適配質量,快速構建操作系統創新軟硬體生態。
2、賽題任務
專題賽賽題:
對於Linux操作系統來説,軟體生態的大批量適配測試一直沒有形成廣泛而通用的UI自動化方案,原因之一在於其軟體類型複雜多樣,比如麒麟操作系統的應用生態,因開發者不同應用可粗略分為自研應用、開源軟體、三方應用等,也可按照應用類型不同分為桌面應用程序、web應用、基於KMRE的移動端應用、基於CrossOver的Windows應用、驅動程序等,因此存在應用開發語言、技術、規範不統一,控件識別難度大等問題,難以形成通用普適的圖形化界面測試方法。
針對Linux UI自動化測試問題,參賽團隊需要構建一個UI控件識別模型或識別工具,並形成文檔。建議採用如下工作步驟:
1)獲取訓練數據集:從各大圖標網站爬取或下載大量數據集,為模型訓練做準備。
2)數據預處理:利用圖像處理技術將獲取的數據集處理成格式類型相同的數據,並對數據進行標注,標注為訓練集和測試集。
3)模型訓練:使用機器學習或深度學習常用算法進行訓練,得到控件識別模型。
4)模型預測與調優:測試模型的識別效果並對模型進行精度調優。
5)形成工具:使用Python編寫控件識別工具,輸入控件截圖可返回控件名稱或控件功能名稱。
*開發語言建議為Python,熟悉常用的自動化測試框架設計,能夠在銀河麒麟桌面操作系統V10 SP1上成功運行,覆蓋的應用可從麒麟軟體商店抽取。
總決賽賽題:
麒麟軟體生態適配體量大,類型複雜多樣、産品迭代速度快給適配測試工作帶來巨大挑戰,問題具體表現在兩個方面。一是用戶真實場景難以覆蓋到。用戶在使用操作系統時,往往涉及到較為複雜的場景,如編輯文檔的同時還會使用實時通信軟體進行聊天。而往往對於操作系統、三方軟體的適配測試是由不測試人員分別開展的,很難保證覆蓋到用戶使用時的更複雜場景。二是回歸測試人工成本高。操作系統與三方軟體的版本快速迭代,尤其是操作系統級別的迭代,在兼容性標準不統一與Linux碎片化的問題得到解決前,每次都需要對倉庫源級別的應用進行大批量的回歸測試;儘管採取了一些UI自動化測試方案,但都需要通過維護自動化腳本來實現測試自動化,隨著産品快速迭代,自動化測試腳本的維護將消耗很大的人力成本和時間成本。
結合國內操作系統生態適配現狀,合理引入技術,形成一套智慧探索測試方案,以真實用戶的視角在操作系統與應用內實現自主探索,全流程無人參與的自動化測試。要求如下:
1)可參考行業內較為成熟的Monkeybot、AI自動化手遊測試等方案,優化設計並形成適用於國內操作系統的《基於AI技術的智慧探索測試方案》,包含問題分析、方案設計、創新點、價值性等內容。在UI控件識別能力、業務理解能力、智慧決策、路徑覆蓋上,要進行具體的分析,給出選型依據,並提供驗證思路。
2)開發實現(可選),包括但不僅限于:一套測試工具支持麒麟多系統(銀河麒麟操作系統V10,銀河麒麟操作系統V10 SP1),建議考慮兼容不少於2種架構(例如X86、ARM、MIPS、990、9006C、LoongArch等);具有主動理解業務的能力,能夠智慧做出決策,擺脫對測試腳本的依賴,有效覆蓋用戶使用的場景。
*決賽賽題更偏重於在智慧探索測試領域找到一個方向或思路,以形成方案為主,代碼實現為輔。
3、賽程賽制
專題賽分為線上初賽和線下復賽兩個階段:
(一)線上初賽:參賽隊伍線上提交作品。大賽專家組依據參賽隊伍進行線上評分,選取優秀者進入線下復賽。
(二)線下復賽:在專題賽主辦地舉辦。通過現場答辯,角逐出優勝獎入圍總決賽。
總決賽:在四川省達州市舉辦。通過現場答辯,評選出一、二、三等獎。
三、2023D3-基於計算硬體平臺的AI大模型遷移
賽題説明
1、賽題背景
在人工智慧領域,ChatGPT、GPT-4、文心一言等大模型已成為當前前沿主題,越來越多的AI公司也加入到大模型研究之中,人工智慧已經發展到了一個新的階段,對底層計算技術也提出了更高要求。
2、賽題任務
參賽隊伍需以曙光計算服務平臺為基礎,進行大模型遷移或研發。
參賽隊伍在研發過程中需基於曙光自研的軟體棧(配套有成熟軟體庫、編譯器等)。
參賽隊伍使用的其他相關軟體建議均使用國産化軟體,如深度學習框架等。
*此處列舉出多種常見大模型:Luotuo-Chinese-LLM、GPT、GLM、Bloom、swin-transformer、transformer、GLIP、Bert-large、stable diffusion、LSTM、MAE、UniVIP、VisualBert、Moco、emae、wav2vec2。(僅供參考,建議參賽選手優先實現中文大模型)
3、賽程賽制
專題賽分為線上初賽和線下復賽兩個階段:
(一)線上初賽:參賽隊伍線上提交作品。大賽專家組依據參賽隊伍進行線上評分,選取優秀者進入線下復賽。
(二)線下復賽:在專題賽主辦地舉辦。通過現場答辯,角逐出優勝獎入圍總決賽。
總決賽:在四川省達州市舉辦。通過現場答辯,評選出一、二、三等獎。
4、賽題技術支持
(1)提供曙光計算服務平臺相關的使用文檔,開發者社區地址,以及技術支持。
(2)提供SoThisAI平臺的功能展示。
(3)提供2~3次的曙光計算服務平臺以及相關硬體的技術培訓,確保參賽團隊可以更快的使用平臺。
(4)提供交流群,在工作時間內為參賽團隊提供各種支持。