數據顯示,今年上半年,國內發布的各類大模型數量超過100個。據不完全統計,目前國內已有大約80個參數在10億規模以上的大模型。推動生成式人工智能基礎設施和公共訓練數據資源平臺建設。促進算力資源協同共享,提升算力資源利用效能。推動公共數據分類分級有序開放,擴展高質量的公共訓練數據資源。鼓勵采用安全可信的芯片(芯片行業分析報告)、軟件、工具、算力和數據資源。算力是數字時代的底座,也是人工智能發展的引擎。據工信部最新消息,截至今年6月底,全國在用數據中心機架總規模超過760萬標準機架,算力總規模達到每秒1.97萬億億次浮點運算(197EFLOPS),算力總規模近五年年均增速近30%,存力總規模超過1080EB。
我國的算力產業有著廣闊的發展前景,因為中國是制造大國,實體經濟對于算力有著很大的需求,游戲、AR、VR等消費領域對算力的需求也很大。有政策支持和技術發展,算力隨取隨用的前景可以期待。我們未來能夠實現像使用水、電一樣使用算力。我國的算力網絡要想滿足大模型的需求,就需要方方面面協同發展。比如,建立通用大模型或行業大模型都需要訓練數據,這就需要把行業的數據保護好、利用好、管理好。
生成式人工智能的功能遠不止提供信息內容服務,其可以作為“技術基座”給金融、醫療、自動駕駛等多個行業領域賦能,未來將成為社會的“技術基礎設施”。明確鼓勵生成式人工智能技術在各行業、各領域的創新應用,生成積極健康、向上向善的優質內容,探索優化應用場景,構建應用生態體系。通用大模型一般指在多個領域應用廣泛的大型深度學習模型,行業大模型則是專門針對某個特定垂直行業所設計的大型深度學習模型,這些模型通常在特定行業中使用的數據集上進行訓練,以提高在該行業中運用的準確度和效率。比較典型的行業大模型,有金融行業的風控模型等。
基于通用大模型的基礎能力,針對行業垂直領域知識和業務場景需求,發展行業大模型已成為技術發展的必然趨勢。一方面,行業特定的知識積累和經驗可以被應用到模型中,提高模型的質量和準確性;另一方面,行業大模型可以通過學習不斷更新迭代,幫助企業更好地理解行業趨勢,做出更為準確的商業決策。
目前,國內已逐步建立起涵蓋理論方法和軟硬件技術的體系化研發能力,一批具有行業影響力的預訓練大模型蓬勃發展,形成了緊跟世界前沿的技術群。以華為云盤古大模型為例,據報道,該大模型已經陸續推出礦山、藥物分子、電力、氣象、海浪等大模型,在各行業落地創新項目超1000個,通過提供先進算法和解決方案,深入大模型的全棧自主創新,加快推動算力國產化。
同時,相比其他國家,中國擁有龐大的實體產業基礎,并正加快構建現代化產業體系,對于人工智能技術與行業應用的深度融合有著更龐大、更迫切、更具價值的實際需求,為人工智能技術創新提供了更為廣闊的創新實踐空間。這也是在大模型時代,國內產業在人工智能領域的機遇所在。