香港股票財經網新聞

Stock-hk.com

來源:品玩

4月7日,阿里巴巴旗下大語言模型——“通義千問”開啟邀測。

開發“通義千問”的阿里巴巴達摩院如是解釋這款大語言模型的命名:“千問,千萬次的問,千萬的學問,能問出千問的一定是真愛,能回答千問的,也一定是真有學問,以及,AI和我們一樣,都有千萬次交互的熱情。”

而在使用邀請碼對大模型產品測試了一天後,我們也有機會和它背後的負責人,阿里雲智能CTO周靖人進行了一次獨家對話,提出了我們的“千問”。

以下為對話實錄:


01 “通義千問”不是起點也不是終點,而是既定路線上的一個節點


品玩:我們今天一直在使用通義千問,它的許多特點讓我們印象深刻,網上也有了很多對產品的測試,我們很好奇你們會怎麽測試它,如何判斷它的表現?

周靖人:怎麽去全面評測一個大模型本身是非常有挑戰的。其實今天整個行業還沒有一個標準。甚至每個人的評價其實也是很主觀的,對吧?

有時候更多的是說,讓模型能面對你的一些回復,揣測到你到底是喜歡哪一種說話的方式,然後會不斷去調整,這本身就是模型在理解方面的一個能力。

我們會有一系列的評測,其中簡單的測試包括一些創作,一些文案的續寫,一些簡單的推理,甚至一些簡單的數學。包括今天跟一些多模態的延展,還有一些知識增強的測試。

現在我們內部是有一個測試集,而慢慢以後都會從讓人去評價一個模型,變成用模型去評價一個模型本身,我們一定會走到這一步。

品玩:那麽如果對標ChatGPT,通義千問現在是什麽水平?

周靖人:我們要承認ChatGPT尤其是GPT4目前還是非常領先的。我覺得這是一個正常的過程。

但直接對比的話,這也很難評價。我們關注的是如何能夠讓我們的模型彌補自己的不足,甚至在更多的一些場景里面有突出的一些能力的表現。今天所有的模型離我們真正去模擬人類的智慧體還有很遠的距離。

品玩:阿里並不是因為ChatGPT的出現才開始密集投入大模型的,之前也展示過很多模型研究的進展,那“通義千問”在阿里的大模型研究歷程里是什麽位置?

周靖人:這個產品是我們的一個中間態。

今天我們在不斷探索基於多模態的大模型的路徑上,或者說接近於多模態真正的趨近人類智慧體的路徑上的一個節點。它不是起點也不是終點,是個既定路線上的節點。我們這次是把過去積累的一部分工作向社會,向開發者開放,但我們在這方面還有長足的工作,需要進一步地去突破去創新。

品玩:盡管你強調多模態,但我們注意到這一次並沒有提供文生圖的功能。

周靖人:對,很多公司在做文生圖,其實達摩院也有相關的一系列工作發表了,像我們的Composer模型等,不光能夠做文生圖,還可以根據你的一些詳細指令去修改這個圖。所以給通義千問接入文生圖並不是最難的,它更多是一個工程上的問題。

我們其實認為,今天更難的是把各個模態的模型能力融入進一個模型,比如怎麽把視覺的能力融入到語言模型里面。因為一個人獲取知識的方式有視覺、語言、聽覺等,不會把它們用獨立的形態分割開來,在人腦里它都是一個可貫通的知識體,能夠把不同形式的輸入有機的聯合在一起。今後的多模態必然能夠做到,不管是任何一個模態來的信息,你的知識體系或者接受到的信號都能夠在一個高維的空間里有機融合在一起。

我覺得這個是必然會發生的。這個也是接下來GPT4或5一定會有突破的地方,我們也在這方面有不少的投入,也是我們認準的一個重要方向。

品玩:也就是說阿里的大模型路線,是多模態的一張藍圖繪到底,而這些都是計劃的一部分。

周靖人:我們從 2019 年就開始嚐試各種各樣的大模型,從StructBERT到M6,再到PLUG再到最新的Composer等一系列視覺模型,其實本質都是在預訓練大模型的整體思路上不斷進行探索,不斷創新。

我認為今天大模型其實在不斷地逼近我們人的智慧。人的智慧很重要的一點就來自於語言,LLM(large language model )開始能根據自然語言理解有效地提取人類大量的知識體系,在這方面是非常獨特的。

今天我們看到類似ChatGPT,類似通義千問所表現出來的一些能力,其實都是在這條道路上。所以對我們行業內的人來講,我們並不認為這條道路好像就是2023 年突然出現。我們認為這是一個長期以來技術發展的演進過程。甚至我們認為今天看到的所謂大模型的能力也都是冰山一角,今後還會有整體更驚人的一系列表現。

我認為ChatGPT的推出,更重要的是教育了整個社會。上一次半年前我們聊到大模型的時候,可能連科技界部分工作者都還不看好這條路線。今天 ChatGPT 基於 Chat 這樣一個產品的形態做得非常出色,把相關的能力有效地表達出來了,不光是對模型一線的工作者,更多是讓大眾和各行各業的人都突然有如夢驚醒的感覺。甚至,今天它給我們整個計算機科學領域都帶來了一個驚訝的反應,或者說快速的教育過程,大家快速認識到基於一個智慧體的預訓練大模型會有多麽出色的表現。

在這個過程中間,我們對ChatGPT所采用的一些技術和各個方面能夠達到的驚豔效果也是感到出乎意料。但阿里不是說今天有了ChatGPT,我們才加入這樣一個陣列,或者說我們才能湊熱鬧,也來做一把模型。其實我們在這方面一直在積累,應該說是國內最早探索大模型方向的公司之一。

02 ChatGPT非常領先,但下次也許就是我們在引領技術的發展


品玩:所以對大模型而言,ChatGPT究竟改變了什麽?

周靖人:它基於SFT(有監督精調),包括基於reinforcement learning(強化學習) 的調優方式讓人眼前一亮。

今天其實我們回過頭去看,模型中融入知識的潛力是巨大的,但是在InstructGPT 出來之前,其實缺乏一個有效的手段把這方面的能力釋放出來。現在這些技術的使用能更有效地把模型作為知識體的能力釋放出來,快速地去解決一些具體的問題。

品玩: 這對大模型研究路線有什麽影響?

周靖人:首先,ChatGPT包括InstructGPT給我們很多啟發,我相信 OpenAI 其實有長足的技術前瞻性,當他發布GPT3. 0 或者 3. 5 版本的時候,實際上是各個方面都陸陸續續已經準備好了。

但最終我們認為類似人類智慧體的預訓練大模型一定是多模態的。我們長期以來在這方面做投入,因此ChatGPT的誕生並沒有讓我們轉變投入方向。後來GPT4的發布其實在無形之中驗證了大家實看法比較一致——AI會朝著多模態的體系進一步發展

所以今天我們方向是一致的,在實現路徑上我們要取長補短,這是科技發展的必經之路。今天ChatGPT有一些很出色的工作,我們要把他們的一系列工作和一些進展融入到我們技術路線里面來。

品玩:如何看AI行業的議程正在被ChatGPT設置這個事實,就是說無論其它玩家做什麽,都會被拿來跟ChatGPT做對標。

周靖人:我覺得這就是科技的魅力。

這種你追我趕是今天科技健康發展的必經之路。任何一個科技都是處於你追我趕中,今天可能我有一些新的想法,能把科技再往前推一步,那下一次有可能是由你來承擔這方面的一些創新,大家都是在互相取長補短,不斷的去推進科技前進。

在不斷取長的過程里,我們也不能妄自菲薄,我們同樣也希望能不斷地去推進最先進的技術進步,下次也許就是我們在推動行業的發展。只有這樣人類的整體科技才能不斷地提升,不斷的創新,不斷地進行突破。

至於今天整個 OpenAI 已經在給我們設置議程,我覺得那是因為它是領先者,這必須承認,而接下來,如何能快速追趕上,如何能快速地去迭代模型將成為一個製勝的關鍵。

也就是說今天我們不乏有一些新的想法,那今天我如何能夠去嚐試?如果說每一次的嚐試它需要花的時間是幾個月甚至更長,那今天你整個的創新速度是跑不起來的。

品玩:它變成了一個系統效率的比拼。

周靖人:今天創新迭代的速度一方面需要我們有一些新的想法,但更重要的是需要今天雲的基礎設施。它能夠讓我們去快速地去嚐試,去試錯,能夠快速拿到反饋,才能讓科技創新不斷加速。

我們講它是一個全方位的競爭,不單單是說今天是模型本身的競爭,其實今天它既是研究又是工程,是從雲的基礎設施到 AI 算法,到今天數據處理,全方位的一個競爭,甚至涉及到了今天我們計算機科學的方方面面。有各種各樣的分布式系統重啟、底層的網絡存儲各個方面都會涉及到。那之所以 OpenAI 能夠做出非常出色的工作,也來源於今天它跟微軟 Azure 的有機結合,其實在無形之中也是強聯合,能夠不斷通過雲的基礎設施,通過整個系統的一系列優化帶動了今天OpenAI不斷創新的速度。

我認為在這一場競爭里面,是一個公司全方位能力的一個表現,如果在任何一個環節稍微落後一點,都會在整個競爭上處於劣勢。

03 “通義千問”其實是一個MaaS(模型即服務)的底座


品玩:也就是可能這個模型並沒有完全成熟,但是它也需要先投入到一個真實甚至是一個商業的環境中去。今天模型的研發跟行業的應用已經在並行進行。

周靖人:對,人們逐漸認識到基於大模型本身強大的對知識理解和推理能力,找到一個如SFT和Prompt等方向後,就能夠把小宇宙慢慢釋放出來。那當然會激發基於大模型的一系列模型應用。

今天一定程度上人工智能業務算法的算法體系已經在改變,今後大家要慢慢學會怎麽在大模型上去做二次的開發,去做相關的一系列算法和工作,包括把它適配到不同的場景。

去年我們在國內首次推出 model as a service模型即服務(MaaS),甚至我們是在全球第一個提出來這樣一個概念。那我們也比較欣慰的看到越來越多的行業、雲計算廠商還有更多的互聯網公司也開始認同這樣的一個觀點,甚至今天也開始按照這樣一個觀點去打造自己的產品服務體系。我們已經已經真正進入到了一個模型的世界。

品玩:那麽MaaS會讓我們和OpenAI走上不同的演進道路麽?

周靖人:我們認為今後 AI 的開發門檻會越來越低,我們期待的是連小學生也能用各種模型進行開發。今後我們需要形成的是一個一個模型的不同層級的結構。

而且一個通用的模型其實也很難解決所有問題。從開發者的角度,它會更多的以模型為第一思考的角度和元素,也就是說今天圍繞著模型作開發的範式會逐漸誕生。我們去年在ChatGPT出來之前就提出並一直在強調 MaaS,其實就是這樣一個理念背後的一系列的思考。

我們在思考模型的生態如何快速發展,所以提出MaaS,為了加速MaaS,我們又創建了“魔搭”這樣的社區。所以幾乎這些工作都是相互強關聯的,是在我們整個AI戰略和模型戰略的主線上。

品玩:通義千問其實也就是MaaS的成果之一,對吧。

周靖人:是的,今天通義千問是以對話作為一個能力的表現形式,但我們期待一些企業級的應用誕生在上面,也就是說今天真正把通義千問模型作為MaaS上面的一個底座,能夠在上面進行額外的開發,能夠真正應用到一些各行各業的場景里面去。那這樣就是真正意義上形成了MaaS。

04 達摩院支持別人在阿里雲上開發大語言模型


品玩:也就是在阿里雲上別人也可以開發自己的模型。

周靖人:我們是非常歡迎的。我們並不認為今天大模型是一家獨大。

我們希望阿里雲能夠為大家提供一個高效的算力,不簡簡單單是一個算力的數字,而是能夠把這部分的基礎設施更好地提供給我們中國的創業公司,幫助他們在 AI 方面實現自己的創新,這樣才能讓中國整體的 AI 能力有一個全方位的提升。

品玩:其實我們對於初創公司做模型這件事情,整個達摩院包括整個阿里的態度其實是相當開放的?

周靖人:對。

品玩:那初創公司做大模型呢?你們怎麽看?

周靖人:我覺得對待大模型,我們科技界一定是要保持開放的心態,對吧?因為很多的創新來自許多新的想法,其實這個我們很難說處於一個壟斷的狀態。

阿里應該說在這方面非常開放,我們願意把我們的模型供大家使用,另外一方面我們也把我們模型所依賴的這樣一個雲的能力也對外進行服務。雖然我們也認識到今天小公司在訓練大模型的經費和技術上有門檻,但我覺得這個是問題本身的特點所帶來的。我們希望有更多的參與者不斷地加入到這方面的科技創新。

05 賣個關子,還有下一款“通義”模型


品玩:今天很多人把大模型的突飛猛進歸結於湧現(emergence)。您是否可以描述一下,通義千問的哪一個研發場景,讓我們覺得這個它可能它是實現了一次非常成功的大規模的湧現?

周靖人:我覺得湧現可能是一個主觀的定義。

品玩:不是一個科學的詞匯,是嗎?

周靖人:對,為什麽這麽說,因為它是對某一個個體認知體系的一個衝擊,這個叫做一個湧現。那當然每個人的認知是不一樣的,所以大家看到同樣結果,也許對我是一個衝擊,對你就不是一個衝擊。

所以對於我們這些科技工作者來講,今天所有的科技發展都是一步步來的。所以我剛才講到,我們之所以從幾年前國內最早就在做相關大模型的研究,如此篤定,其實我們每年都會有各種各樣的一個湧現,我們每一份工作其實都有各種各樣的一個湧現,當然這一次看起來是全社會的一個湧現,每個人都參與,但我還是認為科技的發展總是有一定的積累後,到了一定時刻有一個突破,其實中間有很多的技術細節,很多的know-how。

品玩:所以這些know-how是什麽?很多人說現在找不到,跟煉丹似的,您同意這個說法嗎?

周靖人:我覺得應該說今天我們有點類似處於早期深度學習發展的那個階段。那個時候大家對整個深度學習的理解,也覺得是“不知道為什麽,反正管用”,這點毫無疑問。坦誠地講,今天的進步確實有很多工程以及經驗的因素在里面,這中間的的確確還有很多方面值得研究,包括這個模型深層次的機理。今天我們大概知道這個模型為什麽會有這麽突發的一個表現,但真實的情況我們還是需要有一些理論的研究。

品玩:現在通義千問最希望或者最需要解決的問題是什麽?

周靖人:這個模型可以優化的地方還有非常多。我剛才強調,它只是整體規劃的一個部分,讓大家體驗到我們在工作上的一些進展,但是離我們的整體設計還有長足的工作需要去完成。

比如從模型本身和系統層來講,如何能夠更高效的去服務更大規模模型的訓練,如何接入更多模態,提高在推理側的代碼能力,提升輔助人類日常工作生活方方面面的能力,結合行業知識的定製化能力等。

但是解決過程也是我們科技發展的一個必經之路,今天如果到一個時間點我們都覺得問題解決完了,這個領域也就不再令人興奮了。正因為今天這個是一個剛剛發展起來的嶄新的領域,我們認為想象的空間是巨大的。

品玩:最後一個問題,為什麽叫通義千問,一定要這麽文縐縐的嗎?

周靖人:我們去年9月份的時候就發布了“通義”大模型系列,我們整體一系列的發布不是為了某一次發布而改變的策略,我們是有一個體系化的思考。今天我們發布千問是在我們既定的路線上面的一個節點。

所以通義是一個模型系列的名字,千問主要是指它目前一個主要的對話形態。千萬次的追問是人類獲取智慧的方式,我們希望千問也能夠不斷地學習逼近人類的智慧。

通義千問成為我們通義模型系列中重要的一員。我們接下來很快還會測試另外一款通義的模型,現在賣個關子。它也會叫通義什麽,並且代表今天我們在相關領域的又一個重要進展。

編輯/Corrine

You may also like
你可能會喜歡

標題:對話阿里雲CTO周靖人:通義千問不是起點也不是終點

返回:香港股票財經網新聞

財經新聞常見問題 FAQ

甚麼因素會影響錢財的價值?

由於產品和服務的價格不斷上升,故幣值會隨時間而降低,這便是通貨膨脹。幣值會受以下因素侵蝕通脹:簡單來說,產品和服務的價格上升,就會造成通脹。當物價上升,受薪人士便會要求加薪,隨著通脹加劇,貨幣的購買力便不斷減弱。 利率波動:當利率下降,存款的利息回報便會減少。如果存款利率低於通脹,儲蓄便會失去原有的價值。但某類投資如股票和債券等卻可能因息口下降而升值。

為何銀色債券以債務工具於中央結算系統(CMU) 作清算及儲存 ?

根據銀色債券發行通函,若客戶經配售銀行申請銀色債劵,所分配的銀色債券會以債務工具於中央結算系統(CMU)作清算。

甚麼是債券?

債券是由政府、公司或其他機構發行的一種借貸票據。當您購入債券,即等同向發行者提供貸款,發行者則承諾於債券到期日以指定價格贖回債券,而在到期日前則須支付指定的利息。債券的種類繁多,不同的發行者以不同的條款發行債券。例如:定息債券、浮息債券、零息債券及存款證等。一般來說,債券及存款證的回報比較穩定。目前,銀行可代客買賣多種債券和存款證,除備有多種主要貨幣選擇外,客戶亦可選擇不同債券發行機構,包括政府,如中國政府、美國政府及香港特區政府等,或本地著名的半官方機構,超國機構及世界知名的公司。此外,債券年期由一年至三十年不等,而票面收益亦各異,選擇眾多,能符合投資者的不同需要。投資金額低至港幣1萬元。

甚麼是證券?

證券是一般可在股票市場交易之投資工具的統稱。任何人士均可透過經紀或銀行從事證券投資,並可從每日的報章或互聯網觀察投資行情。 證券投資的回報潛力一般高於儲蓄戶口。在經濟蓬勃的地區,只要假以時日,股市一般都會出現增長,有時更會在短時間內急升。但是,股市波動在所難免,所以購買證券不應視為一種短線的謀利方法。購買證券需要支付有關的交易費用,例如經紀佣金。如果要享有交收的便利,您可考慮採用銀行證券買賣服務。除了自行投資證券外,您亦可委託專業投資管理人員或公司代勞。

何謂「首次公開招股」(IPO)?

「首次公開招股」(IPO)是指一間公司首次向公眾投資者發行新股,債券或銀行發行的存款證。此類股票,債券或存款證有可能在證券交易所上市買賣。

為何我經銀行IPO申請獲分配的通脹掛鈎債券以債務工具於中央結算系統(CMU) 作清算及儲存?

根據通脹掛鈎債券發行通函, 若客戶經配售銀行申請該債劵, 所分配的債券會以債務工具中央結算系統(CMU)作清算,及在銀行的債券買賣服務透過場外交易買賣。

如何啓動我的中國A股交易服務?

如您已持有銀行綜合投資戶口及人民幣儲蓄戶口,即可買賣合資格的中國A股, 毋須登記。如您未持有任何銀行綜合投資戶口,亦可透過銀行銀行網上理財(只適用於現有銀行銀行客戶)或親臨任何一間銀行分行開立綜合投資戶口,過程方便快捷。此服務只適用於非美國個人客戶並持有符合美國稅務局要求的身分證明文件,例如香港永久居民身份証或護照。

參加銀行的「股票月供投資計劃」有什麼好處?

您可以:以符合預算的金額購入股票透過「成本平均法」減低投資風險享受中長線投資所帶來的較高回報潛力迎合個人的儲蓄投資需要

甚麼是單位信託基金?我怎受惠於基金投資?

單位信託基金亦稱互惠基金為投資者提供多元化投資機會,方法是由基金經理把眾投資者的資金,匯聚成一筆龐大基金,用以在廣泛地區及市場作不同的投資。所以,即使個人的投資額不大,投資者亦可參予全球各地市場的證券、債券、貨幣及商品投資。這種多元化投資稱為投資組合。單位信託基金提供多項有利因素:分散風險:由於分散投資,故基金的風險通常低於投資單一股票。但不同的基金,其風險和回報的水平,當然亦會有差異。專業管理:基金經理的日常工作主要是研究和管理投資。個人投資者一般很難像基金經理對全球市場有透徹的認識,但如果購買單位信託基金,便可享有基金經理提供的專業知識。投資全球市場:透過單位信託基金,您的資金可運用於個人投資者未必能夠涉足的海外市場,從而擴闊投資範疇。經濟效益:由於大量投資者的資金以單一基金處理,故能平均攤銷經營成本和佣金,減低個人投資者支付的費用。流動性:您可在任何交易日(但基金所掛屬國家的公眾假期除外)買賣單位信託基金,增加資金流動性。有些單位信託基金產品與各證券交易所上市的指數期權掛屬,亦有時與貨幣期權掛屬。這種基金的風險略高於多元化的基金組合。

什麼是結構投資產品?它是如何運作的?

結構投資產品是涉及衍生工具的投資產品,其回報﹑到期金額及/或其結算方法是參照1) 任何一項或多於一項的參考資產的價格、價值或水平的變動; 及/或 2) 任何事件的發生或不發生而釐定。

有哪些資產屬於要約範圍內?

要約僅針對透過歐洲清算銀行有限公司(Euroclear Bank SA/NV) 直接持有的證券(即債券,存款證和股票),Euroclear Bank SA / NV是本行參與的唯一歐洲經濟區中央證券存管處(例如帶有ISIN 前置代號XS,US,AU,CA)。該要約與透過Euroclear的其他託管人或附屬託管人持有的證券無關。

當「高息投資存款」的存款日為提交指示之後第2個營業日,如何計算綜合理財戶口有抵押信貸的信貸比例?

若已於交易日(Trade Date) 開立「高息投資存款」並處於存款日(Deposit Date)之前的時間: 如以外幣作為存款貨幣,該筆已保留於戶口作為扣除交易所需的款項將會從戶口可用結餘 (account available balance) 中扣除並不會納入有抵押信貸的計算。因此有抵押信貸的信貸額將會下降,基於外幣存款在「高息投資存款」交易日之前被計算為有抵押信貸的信貸額。 如以港元作為存款貨幣,該筆已保留於戶口作為扣除交易所需的款項將亦會從戶口可用結餘 (account available balance) 中扣除並不會納入有抵押信貸的計算。但基於港元存款在「高息投資存款」交易日之前已不納入為有抵押信貸的信貸額,因此有抵押信貸的信貸額不會受影響。 在「高息投資存款」存款日(Deposit Date)當日(即交易日之後第2個營業日),以任何貨幣作為存款貨幣的交易金額將會納入計算為有抵押信貸的信貸額,直至到期日為止。

如何經銀行投資外匯?

您可以經銀行透過多種方法投資外匯。您可使用24小時外幣兌換服務讓您隨時隨地透過網上理財或流動理財設立兌換指示。若您對個別外幣有特定的目標兌換價,您可透過外匯限價買賣服務預設指示。若您想以定期儲蓄的形式累積外幣或人民幣,您可透過外幣/人民幣轉存服務預設兌換指示,我們會根據您的預設指令自動替您執行指示。

要約僅針對透過歐洲清算銀行有限公司(Euroclear Bank SA/NV) 直接持有的證券(即債券,存款證和股票),Euroclear Bank SA / NV是本行參與的唯一歐洲經濟區中央證券存管處(例如帶有ISIN 前置代號XS,US,AU,CA)。該要約與透過Euroclear的其他託管人或附屬託管人持有的證券無關。

您首先需要了解個人的理財需要或投資目標、財政狀況及風險取向。您的目標可包括應付以下各項需要:保障家人子女教育退休策劃管理及累積財富遺產規劃您亦須考慮您的目標,投資年期,可承擔的投資金額及個人的投資偏好。

你們會於何時強制出售我的股票(斬倉?

如(i) 您的股票孖展比率連續3個月維持於105%至少於120%;或(ii) 股票孖展比率一旦觸及120%或以上;或(iii)我們不時訂定之時間,我們將強制出售您的股票(斬倉),不會另行通知。