來源:格隆匯
作者:林春木
繼百度文心一言之後,國內又一巨頭也開始測試AI大模型了——阿里正式加入ChatGPT戰局!
阿里雲大模型來了!
4月7日,阿里雲宣布自研大模型“通義千問”開始邀請用戶測試體驗。
目前,該模型主要定向邀請企業用戶進行體驗測試,用戶可通過官網申請(tongyi.aliyun.com),符合條件的用戶可參與體驗。
據悉,阿里達摩院在NLP自然語言處理等前沿科研領域早已布局多年,並於2019年啟動大模型研發。
2021年,阿里先後發布國內首個超百億參數的多模態大模型M6及被稱為“中文版GPT-3”的語言大模型PLUG,此後還訓練實現了全球首個10萬億參數AI模型。
此次“通義千問”的上線,僅為產品企業邀測,目前尚未正式發布。
不過,小編在第一時間研究了一番。對於為什麽會取這個名字,“通義千問”給出的回答是:
這個名字來源於兩個方面,“通義”意味著該模型具有廣泛的知識和普適性,可以理解和回答各種領域的問題。作為一個大型預訓練語言模型,“通義千問”在訓練過程中學習了大量的文本數據,從而具備了跨領域的知識和語言理解能力。
“千問”代表了模型可以回答各種問題,包括常見的、復雜的甚至是少見的問題。它表達了通義千問致力於滿足用戶在不同場景下的需求,無論問題多麽復雜或者獨特。綜合起來,“通義千問”這個名字表達了這款人工智能語言模型的強大功能和廣泛適用性。
從該模型的功能來看,“通義千問”表示,其基於大量訓練數據,在對話理解能力、代碼寫作能力、多語言支持等方面有著不錯的表現。
比如在創作能力上:
整體來看,“通義千問”在對話中能夠理解和回答各種主題的問題,能有提供更自然、流暢的對話體驗。此外,它具有多種編程語言的理解和生成能力。比如,小編在提問“能否繪畫一張表現今天天氣的圖時”,它還提供了實現這張圖的代碼。
而且除了中文,它還支持其他多種語言的使用需求,如英語、日語、法語、西班牙語、德語等。
ChatGPT競逐賽如火如荼?
作為阿里達摩院自研的一款強大人工智能語言模型,“通義千問”除了上述優勢之外,事實上也仍然存在一些目前AI普遍存在的局限性。比如:
無法理解涉及情感、文化等因素的問題:盡管“通義千問”可以處理大量的文本數據,但是對於一些特定領域的問題,它可能難以理解,因為這些問題涉及到大量的情感、文化和歷史等因素,這些因素可能在語言表達和理解中沒有被充分考慮。
數據質量的影響:“通義千問”是在海量文本數據上訓練而成的,但是數據質量可能會受到諸如語言不規範、數據格式不統一等因素的影響。這些因素可能會對模型的準確性和適用性產生負面影響。
缺乏對特定領域的理解:盡管“通義千問”可以回答各種領域的問題,但是在某些特定領域,它可能缺乏足夠的背景知識和研究,因此難以提供準確的答案。
訓練難度和時間:“通義千問”是一個大型模型,訓練它需要消耗大量的計算資源和時間。這也意味著,在某些情況下,如果問題太復雜或者數據太多,模型可能無法快速地進行訓練和學習。
綜上來看,“通義千問”還是需要不斷的改進和完善。
目前,由ChatGPT展開的全球AI競賽已經進入了激烈的比拼階段,國內外許多知名的科技公司和投資機構也是在摩拳擦掌中。
而據不完全統計,當下國內已經開放AI大模型的主要有:百度公司的文心一言、阿里巴巴達摩院的通義千問、騰訊公司的絕影、華為公司的昇騰、商湯科技的湯圓、曠視科技的Face++、依圖科技的圖騰等。
更值得關注的是,接下來大模型發布會也會密集來襲。
從目前市場消息統計來看,華為、商湯、阿里、AIGC Chain、同花順、科大訊飛、谷歌、微軟等都將在近期舉行關於AI產品的發布會。
縱觀市場,在AI大模型探索之路上,國內外的科技巨頭們正在快馬加鞭、你追我趕;而在國內這場大模型競賽戰場上,開戰的號角已經吹響,誰能鏖戰至最後取得勝利是值得期待的。
編輯/hoten