來源:華爾街見聞
作者:尹洪昌
近日,繼百度之後,阿里、華為、京東、360等大模型也陸續浮出水面,大模型軍備競賽正式開啟。
4月7日,阿里雲宣布自研大模型“通義千問”開始邀請企業用戶測試體驗。
4月8日上午,華為雲人工智能領域首席科學家田奇現身《人工智能大模型技術高峰論壇》,分享了華為雲盤古大模型的進展及其應用。
同是4月8日召開的人工智能大模型技術高峰論壇上,京東集團副總裁何曉冬表示,針對真實的產業需求,京東將在今年發布新一代產業大模型,言犀是“京東版”ChatGPT,言犀大模型預訓練參數達到千億級,品類覆蓋3000+,人工審核通過率95%+、生成文字30億+。
4月9日晚,360正式官宣,基於360GPT大模型開發的人工智能產品矩陣“360智腦”率先落地搜索場景,將面向企業用戶開放內測。
據民生證券根據公開信息不完全統計,目前國內至少已經有30多家大模型亮相,其中不乏參數規模甚至超過ChatGPT規模的大模型,廠商涵蓋了互聯網巨頭、AI上市公司、服務器龍頭企業、科研院所與一級市場創業公司。

當大模型不再稀缺,得數據者得天下
民生證券表示,大模型表面不再稀缺後,實質格局更像“太極拳”:易學難精。
其指出,因為開源基礎以及大公司本身的算力儲備與資金實力,單純發布一個大模型門檻並沒有市場想象那麽高,但能夠擁有高質量數據場景助力持續迭代,使得逐步性能逼近ChatGPT的大模型預計最終仍是“鳳毛麟角”。市場會逐步凝結共識:得數據者得天下,數據將成為大模型差異化競爭的關鍵。
興業證券也表示,受製於算力資源、商業模式等原因,國內市場針對2B垂直領域、基於大模型精調之後的小模型有望率先商業化落地,百度、華為、彭博等已陸續發布多個垂直行業大模型,而要訓練專業的行業大模型,優質的行業數據、公共數據至關重要。
其同時指出,AI三大核心要素算力、算法和數據,數據是AI算法(模型)的“飼料”,重要性甚至超過算法和算力。
就國內數據市場而言,據發改委官方批露,我國政府數據資源占全國數據資源的比重超過3/4,但開放規模不足美國的10%,個人和企業可以利用的規模更是不及美國的7%。因此,其表示加強公共數據的開放開發,是當前急需落實的核心問題,而國家數據局的組建有望,或將從數據源頭加快重要政務部門、重點關鍵行業的數據分類、確權進程。
國盛證券也表示,AIGC算法日新月異,更加證明數據要素在當今的重要性。
其指出,Meta發布基礎模型SAM並開源。SAM已在1100萬張圖片和11億個掩碼的數據集上進行了訓練,具有超強的自動識別、切割功能。其認為,SAM使用的1100萬張圖片訓練集僅是一個開始,未來隨著用戶數量增加,SAM的圖片訓練量和分割掩碼體量會呈指數級增長,因此數據要素的價值應得到持續關注。
數據要素領域動作頻頻
據浙商證券梳理,近兩周內,國內多地政府頻出數據政策,加速數字化建設。
首先是,哈爾濱市大數據中心《網信部門行政執法程序規定》,規範和保障了網信部門依法履行職責,保護了公民、法人和其他組織的合法權益,維護國家安全和公共利益。
其次是,深圳市發展和改革委員會公示《深圳市數據產權登記管理暫行辦法》征求意見稿結果,針對這些意見和建議,發改委已經采納並做出相應調整,包括明晰數據資源持有權、數據加工使用權、數據產品經營權的概念、優化數據資源和數據產品的名詞解釋等;
接著是,蘇州市大數據管理局為了規範和促進本市公共數據開放、激活數據要素潛能,全面賦能數字蘇州建設而製定發布《蘇州市公共數據開放實施細則(征求意見稿)》;
然後是,河南省製造強省建設領導小組辦公室發布《2023年河南省大數據產業發展工作方案》,提出2023年全省大數據產業規模將增長25%以上,基礎設施將不斷完善,5G基站總數將突破18萬個,新型數據中心和邊緣數據中心將得以建設。
此外,3月28日,第三屆兩化融合暨數字化轉型大會在江蘇蘇州召開;3月31日,上海數據交易所上線國內首個數據交易鏈;4月1日,深圳數據交易所完成增資。4月3日,銀保監會將全面開展非銀機構數據治理工作。
浙商證券表示,數據政策不斷湧現,為數據要素的興起注入法治精神和製度動力,孕育優越外部環境,國內數據要素市場蒸蒸日上,展現出蓬勃生機。
哪些數據要素應用有望率先落地?
招商證券表示,我國組建國家數據局,負責協調推進數據基礎製度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設等。其認為,國計民生類數據有望率先成為國家數據局試點改革的領域,重點可關注醫保數據及交通數據兩個方向。
其中醫保方面上周市場已充分演繹,醫療+AI大漲,龍頭久遠銀海4天3板。一方面,全國統一醫保信息平台已在31省全域上線,覆蓋支付方式、跨省異地就醫、公共服務等多個子系統,實現全國醫保業務編碼標準統一、數據規範統一、經辦服務統一,也實現國家/省/市/縣四級醫保部門以及醫保與人社等部門和醫療機構等單位的數據互聯互通。另一方面,國家醫保局等持續深化醫保數據治理水平,通過治理規範、質量評估標準等的建立為醫保大數據應用提供基礎。
第二就是交通數據。
招商證券表示,多項交通大數據相關頂層政策連發,智慧交通政策驅動強。
2022年10月國務院印發的《全國一體化政務大數據體系建設指南》中,提出全國一體化政務大數據體系按需接入供水、供電、供氣、公共交通等公共服務運營單位在依法履職或者提供公共服務過程中收集、產生的公共數據;鼓勵各地區各部門開展應用創新,在普惠金融、衛生健康、社會保障、交通運輸、應急管理等領域開展試點,推進重點領域政務數據深度應用。
2023年2月國務院印發的《數字中國建設整體布局規劃》中,提出要推動數字技術和實體經濟深度融合,在農業、工業、金融、教育、醫療、交通、能源等重點領域,加快數字技術創新應用。多項國家級政策連發,智慧交通頂層設計明確,政策驅動強。
編輯/jayden