香港股票財經網新聞

Stock-hk.com

來源: 量子位

阿里正式加入ChatGPT戰局!

就在剛剛,阿里版類ChatGPT突然官宣正式對外開放企業邀測。

它叫通義千問,由達摩院開發。

嗯,是大模型版十萬個為什麽那個味兒了。


事實上,早在這個月初,就傳出過不少阿里要推出類ChatGPT的消息,不過普遍預期在11號左右。

而前幾天率先流出的天貓精靈“鳥鳥分鳥”脫口秀版GPT,就是基於大模型的“壓縮版”,已經以其驚豔表現把網友的胃口吊了起來,讓眾人將目光投向阿里。

如今“正菜”提前上桌,自然一點即著,引爆輿論關注。

所以,這個阿里版ChatGPT“通義千問”,究竟實力幾何?

恰好量子位拿到了第一批邀測資格,省流結論:中文大模型真正的競爭開始了。

咱們實測見真章。

調戲阿里版ChatGPT實錄


先來看看通義千問的主要功能。

作為一個大語言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一樣“問咩答咩”:


這里我們試一下官方給的撰寫短文,看起來連語文老師常用的“總分總”也能理解:


又一個中文寫作業神器(doge)
又一個中文寫作業神器(doge)

除了對話外,它還具備一個“百寶袋”功能,里面相當於一個工具箱,能快速生成各種指定類型的文案:


話不多說,先從語言能力、上下文理解能力、代碼能力和數學能力四個方向,來測測模型的對話能力。

一、對話能力


語言能力


要說國內大模型,首先要看的還得是中文。

先來個最基礎的:“能穿多少穿多少”是什麽意思?

不錯,解釋得比較清楚,還順便聊了一下自己對這句話的看法:


續寫類的創意寫作,不但能模仿語氣,甚至還能創造懸疑,有點厲害喲~


接下來就輪到新一代AI benchmark弱智吧問題了:怎麽才能把夢里的錢取到銀行卡里?

“在夢里取錢是一種幻覺或想象”,謝謝你清醒俠。


還有更紮心的……“如果您經常做夢夢到錢,建議您睡前回顧一下自己的財務狀況,看看有什麽不足之處”


雖然阿里的朋友稱,通義千問主要是中文不錯,但我們叛逆一點,看看這個中文大語言模型的其他語言水平怎麽樣。


先不走尋常路,試試通義千問的日語能力,給花澤香菜寫一封情書。

看中文機翻似乎還不錯,這就把它寄給香菜,應該沒問題吧?


再來試試英語。剛好前段時間有網友PK了一下Bard和GPT-4的Rap,我們也來看看通義千問的說唱能力。

這top,這stop,還給押上了!就是不知道姆爺認不認可。


試試加點難度,中英夾雜的諧音梗?

這個時候,通義千問的回答就顯得有點嚴肅了。


當我們給出答案的時候,雖然通義千問看出了這是個笑話,但它並不覺得好笑,還很嚴肅地指正我們:這並不意味著鬆下懼怕索尼。


不過我們發現,ChatGPT同樣一本正經……這年頭的AI都這麽正義麽……


好,下一個試試它的上下文理解能力。

上下文理解能力


這部分說白了就是多輪對話能力,考查通義千問能不能準確提取上文的信息,用於下輪問題的回答。

來聽題:山東一縣一酒是真的嗎?


模糊掉山東試試?讓它列舉“這個省”幾個經典的白酒牌子:


不錯。再試著從最新的回答中追問一下:


等等,“據史書記載”不會是編的資料吧?追問×2:


有意思的是,我們確實在孔府家酒的官網找到了資料來源:


代碼能力


接著,來試試它的代碼能力。整個計算器程序試試?


還不錯,實現了簡單的四則運算。完整版代碼如下,感興趣的胖友們可以試試:


那麽,讓將它這段代碼改寫成Python:


再讓它解釋一下自己寫過的每一段代碼:


基礎編程能力,似乎問題不大?

不過,如果要讓通義千問將解釋改寫成注釋,就會出現一點神奇的bug。

雖然它給“Python”代碼標好了注釋,但等等,這不是最初的C++版代碼嘛!


(這何嚐不是一種NTR)

數學能力


最後來看看數學問題。雞兔同籠,還不錯:


普通的計算題也沒什麽問題,還能精確到小數點後幾位:


巴特,高數題就不太行了,雖然它發現了這道題需要求導,但求解方法卻出了錯……


不過通義千問也明確表示,無法保證在所有情況下給出正確的答案:


嗯…和GPT們一樣,大模型的數學能力都比較初級。

對話能力測得差不多,接下來再看看它的“場景能力”。

二、場景能力


雖然通義千問“百寶袋”給出了不少功能,不過寫提綱、描述商品這些都很常見了,我們就挑了三個比較有意思的來試試:菜譜生成、彩虹屁生成器和免費代寫情書。

會放飛的菜譜


眾所周知,寫菜譜是個技術活兒,既考驗上下文能力(說過的材料都得用到),還得考考AI的理解菜名能力,做菜的步驟還不能太離譜。

示例的“清蒸鱸魚”,對AI來說顯然太簡單了。這不得整點遊戲里奇怪的菜名給它試試?

先來一份《原神》里的飽腹感凝膠。


好家夥,竟然想到用現實中的魔芋粉來模仿飽腹感凝膠,這創意不錯。(不過卡路里粉是什麽鬼,蛋白粉嗎?)


那麽,同樣的菜再試試讓ChatGPT做一遍,你感覺哪個更好吃?


再給通義千問來道加試題,讓它試試《星露谷物語》里面,用虛空蛋做的奇怪的小面包?

等等,真把虛空蛋放進食譜了?而且還真的做了份面包出來!就是不知道口感如何……


照這樣看,遊戲中的食譜都能給通義千問還原一遍了,直接打破次元壁。


彩虹屁生成器


接下來,再試試讓它生成一份彩虹屁。


硬生生把衣服上的油漬誇成了藝術品……


嗯,各大誇誇群可以考慮引入一個了。


免費代寫情書


最後,我們的測試以給野獸先輩寫一份情書做結尾。


你感覺怎麽樣?


好了,看了這麽多五(奇)花(奇)八(怪)門(怪)的測評,你是不是也有點好奇通義千問是怎麽來的了?

通義千問從何而來?


關於通義千問的技術細節,阿里達摩院官方沒有透露詳細信息。

而通義千問自己,是這麽回答的:

訓練資料來自阿里巴巴達摩院,截止到2023年2月。訓練資料包括大量語言和文本數據,包括中英日法西班牙語多語種文本數據。

還提到自己是個能聯網的大語言模型。


不過,我們實測了一下,發現千問只是虛晃一槍,假裝自己會上網(doge)。

實際上,當你單獨問它今天天氣如何時,通義千問會承認它不能訪問實時數據

但如果你拋給它一個查詢天氣的網站,它就會假裝自己看到了網頁內容,然後一本正經地胡謅一番。


此處應喊話阿里程序員:你家大模型是真的想上網了。


書歸正傳,盡管官方口徑低調,但正如ChatGPT脫胎於OpenAI的GPT系列,百度文心一言是自Ernie大模型發展而來,阿里也是國內最早開始研發大模型的技術大廠之一。

公開資料顯示,2019年,阿里就已經啟動了中文大模型研發。當時阿里發布的語言大模型StructBERT超越谷歌、微軟、Facebook,登頂了CLUE榜單。

2021年,阿里先後發布了國內首個超百億參數多模態大模型M6,以及被稱為“中文版GPT-3”的語言大模型PLUG

其中,M6在多次迭代之後,實現了十萬億級別的參數規模,並且M6和支付寶、淘寶的業務需求相結合,首個在國內實現了商業化落地。

PLUG的參數規模則為270億,是基於達摩院的兩種自研模型——語言理解模型StructBERT和語言生成模型PALM打造。

這一大模型初登場,就以80.614分刷新了權威中文語言理解基準CLUE分類任務榜單記錄。


在去年的WAIC(世界人工智能大會)上,阿里還發布了通義大模型系列。其中核心模型均已開源開放。


大模型時代,中國力量加速競逐


那麽,你會給這個阿里版ChatGPT打幾分?

需要承認的是,相比於現在的業界標桿ChatGPT(GPT-4),通義千問還有不少進步空間。阿里方面也透露,根據內測反饋,這一大模型正在飛速迭代中。

此前,微軟被曝曾專門為ChatGPT砸下數億美元,打造由上萬張英偉達A100組成的專用超算。而綜合各方消息來看,目前國內擁有這一數量級高性能顯卡的企業屈指可數,阿里是其中之一。

大模型時代,已經形成行業共識的一點是,打造大模型,AI和雲計算缺一不可。

而阿里,是全球少數在算法和算力上都有領先布局的公司之一。

除了本身在人工智能和大模型方面長期的技術積累,背靠國內第一、亞洲第三的雲廠商,阿里在算力方面也具備天然的優勢。


ChatGPT這把火燒到如今,國內對具備足夠競爭力的國產生成式大模型的需求,正在與日俱增。

ChatGPT類產品提升生產效率的潛力,已經被不斷驗證。但與此同時,前有ChatGPT大規模封號、亞洲成重災區,後有OpenAI因算力問題停售ChatGPT Plus……

種種不確定因素,再一次凸顯了技術自研的價值。

所幸這次,我們的起跑線,並沒有相差那麽遠。

遊戲不會在一夜間結束,而現在,競逐真正開始。

編輯/jayden

You may also like
你可能會喜歡

標題:阿里版ChatGPT突然上線邀測!大模型熱戰正劇開始,這是第一手體驗實錄

返回:香港股票財經網新聞

財經新聞常見問題 FAQ

甚麼因素會影響錢財的價值?

由於產品和服務的價格不斷上升,故幣值會隨時間而降低,這便是通貨膨脹。幣值會受以下因素侵蝕通脹:簡單來說,產品和服務的價格上升,就會造成通脹。當物價上升,受薪人士便會要求加薪,隨著通脹加劇,貨幣的購買力便不斷減弱。 利率波動:當利率下降,存款的利息回報便會減少。如果存款利率低於通脹,儲蓄便會失去原有的價值。但某類投資如股票和債券等卻可能因息口下降而升值。

為何銀色債券以債務工具於中央結算系統(CMU) 作清算及儲存 ?

根據銀色債券發行通函,若客戶經配售銀行申請銀色債劵,所分配的銀色債券會以債務工具於中央結算系統(CMU)作清算。

甚麼是債券?

債券是由政府、公司或其他機構發行的一種借貸票據。當您購入債券,即等同向發行者提供貸款,發行者則承諾於債券到期日以指定價格贖回債券,而在到期日前則須支付指定的利息。債券的種類繁多,不同的發行者以不同的條款發行債券。例如:定息債券、浮息債券、零息債券及存款證等。一般來說,債券及存款證的回報比較穩定。目前,銀行可代客買賣多種債券和存款證,除備有多種主要貨幣選擇外,客戶亦可選擇不同債券發行機構,包括政府,如中國政府、美國政府及香港特區政府等,或本地著名的半官方機構,超國機構及世界知名的公司。此外,債券年期由一年至三十年不等,而票面收益亦各異,選擇眾多,能符合投資者的不同需要。投資金額低至港幣1萬元。

甚麼是證券?

證券是一般可在股票市場交易之投資工具的統稱。任何人士均可透過經紀或銀行從事證券投資,並可從每日的報章或互聯網觀察投資行情。 證券投資的回報潛力一般高於儲蓄戶口。在經濟蓬勃的地區,只要假以時日,股市一般都會出現增長,有時更會在短時間內急升。但是,股市波動在所難免,所以購買證券不應視為一種短線的謀利方法。購買證券需要支付有關的交易費用,例如經紀佣金。如果要享有交收的便利,您可考慮採用銀行證券買賣服務。除了自行投資證券外,您亦可委託專業投資管理人員或公司代勞。

何謂「首次公開招股」(IPO)?

「首次公開招股」(IPO)是指一間公司首次向公眾投資者發行新股,債券或銀行發行的存款證。此類股票,債券或存款證有可能在證券交易所上市買賣。

為何我經銀行IPO申請獲分配的通脹掛鈎債券以債務工具於中央結算系統(CMU) 作清算及儲存?

根據通脹掛鈎債券發行通函, 若客戶經配售銀行申請該債劵, 所分配的債券會以債務工具中央結算系統(CMU)作清算,及在銀行的債券買賣服務透過場外交易買賣。

如何啓動我的中國A股交易服務?

如您已持有銀行綜合投資戶口及人民幣儲蓄戶口,即可買賣合資格的中國A股, 毋須登記。如您未持有任何銀行綜合投資戶口,亦可透過銀行銀行網上理財(只適用於現有銀行銀行客戶)或親臨任何一間銀行分行開立綜合投資戶口,過程方便快捷。此服務只適用於非美國個人客戶並持有符合美國稅務局要求的身分證明文件,例如香港永久居民身份証或護照。

參加銀行的「股票月供投資計劃」有什麼好處?

您可以:以符合預算的金額購入股票透過「成本平均法」減低投資風險享受中長線投資所帶來的較高回報潛力迎合個人的儲蓄投資需要

甚麼是單位信託基金?我怎受惠於基金投資?

單位信託基金亦稱互惠基金為投資者提供多元化投資機會,方法是由基金經理把眾投資者的資金,匯聚成一筆龐大基金,用以在廣泛地區及市場作不同的投資。所以,即使個人的投資額不大,投資者亦可參予全球各地市場的證券、債券、貨幣及商品投資。這種多元化投資稱為投資組合。單位信託基金提供多項有利因素:分散風險:由於分散投資,故基金的風險通常低於投資單一股票。但不同的基金,其風險和回報的水平,當然亦會有差異。專業管理:基金經理的日常工作主要是研究和管理投資。個人投資者一般很難像基金經理對全球市場有透徹的認識,但如果購買單位信託基金,便可享有基金經理提供的專業知識。投資全球市場:透過單位信託基金,您的資金可運用於個人投資者未必能夠涉足的海外市場,從而擴闊投資範疇。經濟效益:由於大量投資者的資金以單一基金處理,故能平均攤銷經營成本和佣金,減低個人投資者支付的費用。流動性:您可在任何交易日(但基金所掛屬國家的公眾假期除外)買賣單位信託基金,增加資金流動性。有些單位信託基金產品與各證券交易所上市的指數期權掛屬,亦有時與貨幣期權掛屬。這種基金的風險略高於多元化的基金組合。

什麼是結構投資產品?它是如何運作的?

結構投資產品是涉及衍生工具的投資產品,其回報﹑到期金額及/或其結算方法是參照1) 任何一項或多於一項的參考資產的價格、價值或水平的變動; 及/或 2) 任何事件的發生或不發生而釐定。

有哪些資產屬於要約範圍內?

要約僅針對透過歐洲清算銀行有限公司(Euroclear Bank SA/NV) 直接持有的證券(即債券,存款證和股票),Euroclear Bank SA / NV是本行參與的唯一歐洲經濟區中央證券存管處(例如帶有ISIN 前置代號XS,US,AU,CA)。該要約與透過Euroclear的其他託管人或附屬託管人持有的證券無關。

當「高息投資存款」的存款日為提交指示之後第2個營業日,如何計算綜合理財戶口有抵押信貸的信貸比例?

若已於交易日(Trade Date) 開立「高息投資存款」並處於存款日(Deposit Date)之前的時間: 如以外幣作為存款貨幣,該筆已保留於戶口作為扣除交易所需的款項將會從戶口可用結餘 (account available balance) 中扣除並不會納入有抵押信貸的計算。因此有抵押信貸的信貸額將會下降,基於外幣存款在「高息投資存款」交易日之前被計算為有抵押信貸的信貸額。 如以港元作為存款貨幣,該筆已保留於戶口作為扣除交易所需的款項將亦會從戶口可用結餘 (account available balance) 中扣除並不會納入有抵押信貸的計算。但基於港元存款在「高息投資存款」交易日之前已不納入為有抵押信貸的信貸額,因此有抵押信貸的信貸額不會受影響。 在「高息投資存款」存款日(Deposit Date)當日(即交易日之後第2個營業日),以任何貨幣作為存款貨幣的交易金額將會納入計算為有抵押信貸的信貸額,直至到期日為止。

如何經銀行投資外匯?

您可以經銀行透過多種方法投資外匯。您可使用24小時外幣兌換服務讓您隨時隨地透過網上理財或流動理財設立兌換指示。若您對個別外幣有特定的目標兌換價,您可透過外匯限價買賣服務預設指示。若您想以定期儲蓄的形式累積外幣或人民幣,您可透過外幣/人民幣轉存服務預設兌換指示,我們會根據您的預設指令自動替您執行指示。

要約僅針對透過歐洲清算銀行有限公司(Euroclear Bank SA/NV) 直接持有的證券(即債券,存款證和股票),Euroclear Bank SA / NV是本行參與的唯一歐洲經濟區中央證券存管處(例如帶有ISIN 前置代號XS,US,AU,CA)。該要約與透過Euroclear的其他託管人或附屬託管人持有的證券無關。

您首先需要了解個人的理財需要或投資目標、財政狀況及風險取向。您的目標可包括應付以下各項需要:保障家人子女教育退休策劃管理及累積財富遺產規劃您亦須考慮您的目標,投資年期,可承擔的投資金額及個人的投資偏好。

你們會於何時強制出售我的股票(斬倉?

如(i) 您的股票孖展比率連續3個月維持於105%至少於120%;或(ii) 股票孖展比率一旦觸及120%或以上;或(iii)我們不時訂定之時間,我們將強制出售您的股票(斬倉),不會另行通知。