計算機科學家吳恩達曾在《為什麽AI是新電能》中寫道:如今我絞盡腦汁,也想不出幾年後還有什麽行業是AI改變不了的。
從早期的圖像識別、語音識別開始,AI技術落地驅動著一波又一波產業改革。近期智能聊天機器人ChatGPT爆火,同樣被視為AI產業奔湧向前的一大標誌性事件。不過,從技術成熟度、市場接受度而言,這類應用要形成商業閉環還需要更多時間。
ChatGPT出圈,巨頭入局熱炒
在ChatGPT掀起聊天機器人全民熱潮之後,來自大洋兩岸的搜索巨頭們不得不躬身入局。
2月7日,$百度集團-SW(09888.HK)$確認,自然語言生成項目“文心一言(ERNIE Bot)”正在進行上線前的衝刺,坐實了其正對標美國AI聊天機器人ChatGPT開發應用的傳言。一位接近百度的人士對市界表示,“百度在相關技術層面有積累,比如文心大模型,有望最先開發出此類產品。”
同一天,$谷歌-C(GOOG.US)$宣布將在未來幾周推出實驗性對話式AI(人工智能)模型Bard。此前在一月份,谷歌還宣布其子公司DeepMind的聊天機器人Sparrow可能會在晚些時候進入測試階段。
2月8日淩晨,$微軟(MSFT.US)$也“擼起袖子”,宣布推出由ChatGPT支持的最新版本Bing(必應)搜索引擎和Edge瀏覽器,此舉致使微軟市值一天升漲超800億美元(約5450億元人民幣)。
搜索三巨頭紛紛下場的原因,還要追溯到約兩個月前,美國AI研究機構OpenAI在2022年底發布智能聊天機器人ChatGPT。該應用堪稱史上最會聊天的AI應用,能夠提供流暢、貼合語境的溝通體驗,且推出僅5天,用戶數就突破100萬。瑞銀集團的一份報告推測,截至1月末,ChatGPT的月活用戶已經突破了 1 億。
大洋彼岸的ChatGPT爆火,讓百度“坐不住”了。百度表示,文心一言預計將於3月份完成內測,而且按照谷歌和微軟的節奏,開放內測時間還有可能提前。消息放出後,2月7日百度集團港股股價大漲15.33%。
“上火”的也不僅僅是搜索玩家。目前,奢侈品電商寺庫已宣布將引入ChatGPT。相關概念股連續多日上漲,多支漲幅在10%以上,更有部分個股走出了“六連板”的行情。
然而,二級市場燃起的這把熊熊烈火,背後卻充滿了隱憂。
在2月7日百度宣布“類ChatGPT應用”文心一言三月份完成內測並將面向公眾開放的消息後,當日該股大漲逾15%,而在接下來的兩天,百度上漲勢頭未能延續,截至今日收盤,該股跌近4%。
同時,另一家入場的搜索引擎巨頭$谷歌-C(GOOG.US)$也因其最新的Bard聊天機器人在宣傳視頻中的“失敗”表現,股價遭遇“滑鐵盧”,一夜間市值抹去逾1000億美元。
在谷歌的這則宣傳廣告中,Bard得到了這樣的提問:“我可以把詹姆斯·韋伯空間望遠鏡的哪些新發現講給我9歲的孩子聽?”
Bard提供了一些答案,其中一個答案顯示,詹姆斯·韋伯望遠鏡被用來拍攝了太陽系外行星的第一批照片。這是不準確的,因為第一批系外行星的照片是由歐洲南方天文台的甚大望遠鏡在2004年拍攝的,這一點得到了美國國家航空航天局的證實。
谷歌的一位發言人表示:“這凸顯了嚴格測試過程的重要性,這正是我們本周啟動受信任測試人員計劃的原因。我們將把外部反饋與我們自己的內部測試結合起來,以確保Bard的回答在質量、安全性和根植於現實世界信息方面符合高標準。”
D.A. Davidson的高級軟件分析師Gil Luria稱:“雖然谷歌在過去幾年中一直是人工智能創新的領導者,但他們在將這項技術應用到搜索產品上時似乎‘睡著了’。過去幾周,谷歌一直在爭分奪秒地追趕(微軟),這導致此次很倉促,出現了宣傳廣告中發布錯誤答案的尷尬局面。”
開年第一爆
ChatGPT能有如此瘋的行情,應該說是“久旱逢甘霖”。
根據Gartner曲線,一項新興技術從萌芽走向市場成熟,還需要經過市場泡沫的產生與破滅。而從2020年開始,業界認為AI產業已經進入泡沫破裂的“死亡之谷”。這樣的背景中,ChatGPT的興起讓整個AI產業看到了一絲曙光。
IPG中國首席經濟科學家柏文喜向市界分析道:“近期ChatGPT及其他AIGC(AI生成內容)應用的興起,可以認為是產業邁進“復蘇期”的一個征兆和興奮點,盡管尚處於發展早期,但ChatGPT等應用可能提供豐富的消費互聯網應用場景,所昭示的前景與錢景都是不言而喻的。”
《AIGC發展趨勢報告2023:迎接人工智能的下一個時代》援引AI作畫平台6pen的預測稱,未來五年10%-30%的圖片內容將由AI參與生成,有望創造超過600億的市場規模。而據Gartner統計,當前生成式AI占據所有生成數據的比例不到1%,預計到2025年這一占比將達到10%。
與廣闊前景相對應的,是豐富的投資機會。
AIGC可細分為文本生成、音頻生成、圖像生成、視頻生成、跨模態生成(如文字生成圖像、文字生成視頻等)等技術場景,應用場景則集中在娛樂、傳媒、電商等數字化程度高、內容需求豐富的行業。此前,人臉美妝、黑白圖像上色、電商商品3D模型生成等AIGC應用,已經在許多場景中實現落地。
在ChatGPT為代表的聊天機器人(chatbot)領域,亦有許多科技企業推出面向特定需求的相關應用。比如,微軟和亞馬遜都曾推出智能個人助理,分別命名為Cortana和Alexa等。
不過,ChatGPT與以往的聊天機器人不同的是,其展現出的知識儲備廣度和智能程度超過了以往的許多模型,堪稱“上知天文下知地理”。
但是,ChatGPT被設計無法連接到互聯網,因此目前其“知識庫”中儲備的信息截至2021年,並不能持續更新。這也被視為未來聊天機器人可以持續改善的一個方向,谷歌最新推出的Bard機器人就被允許聯網,接收實時信息。
近期隨著ChatGPT熱度持續上升,科技巨頭相繼入局,AIGC概念隨之發酵。2月7日,國內智能人機交互企業漢王科技A股觸及漲停板,港股$美圖公司(01357.HK)$在2月7日股價大漲15%。
根據國海證券研報,AIGC產業鏈可簡要分為上遊數據供給方;中遊AIGC算法及模型研發方;下遊基於AIGC的各類內容創作及分發平台環節。AIGC應用不斷深化,有望為整條產業鏈的發展帶來利好。
洛克資本投資合夥人馬統娟稱:“當前,AI行業正處在蓄力等待新風口的時期。在圖像識別、語音識別、建模、機器人控製等早期應用領域,第一批企業機構已經形成了現有格局。隨著ChatGPT引爆的新熱點出現,有利於新的玩家加入,開辟新的賽道。”
新希望還是新危機?
如果說ChatGPT為AI產業帶來了新的希望,那麽對搜索引擎巨頭來說,希望中還夾雜著一絲發展危機。
據投行瑞銀集團近日發布的一份研究報告,ChatGPT的月活躍用戶在今年1月份預計達到了1億,已成為史上增長最快的消費者應用,增速超過TikTok、Instagram等現象級應用。據應用分析公司Sensor Tower的數據,TikTok和Instagram達到1億月活用戶的時間,分別為9個月和兩年半。
ChatGPT的快速增長,讓人看到了新型消費互聯網業態的雛形,也讓許多互聯網大廠感受到了被新興應用取而代之的焦慮。首當其衝的,就是搜索引擎。
投行摩根士丹利的首席谷歌分析師布萊恩·諾瓦克在一份報告中寫道,語言模型可能會“顛覆谷歌作為人們上網入口的地位。”就連谷歌的23號員工、Gmail的創始人保羅·布赫海特也於近日提出:“谷歌可能只需要一兩年時間就會被徹底顛覆。AI將會消滅搜索引擎的結果頁面,即便谷歌跟上了人工智能的發展,其最能賺錢的業務也將大不如前。”
而這類預測,正是基於ChatGPT類應用可能帶來的顛覆性搜索體驗。
馬統娟對市界分析道,在未來,如果將ChatGPT類應用整合進現有搜索引擎,有可能進一步提升用戶獲取信息的效率。
相比傳統搜索引擎為用戶提供列舉出關鍵詞相關鏈接索引的模式,ChatGPT則可以依據其龐大的知識庫,直接對用戶的問題給出解答。“用戶對於搜索引擎的需求是信息獲取。如果有直接得到答案的方式,肯定不願意選擇瀏覽的方式。在我看來,ChaGPT的目標並不是取代搜索引擎,而是改變人們獲取信息的方式。相比於搜索引擎‘框計算’的模式,ChatGPT背後信息組織的方式,反饋方式則有了不同。”
這也解釋了三大搜索引擎大廠谷歌、微軟、百度紛紛下場,押注對話式語言生成模型的原因。
實際上,隨著消費互聯網紅利見頂,增長放緩成為了搜索巨頭們的共同問題。據觀研天下調研,我國搜索引擎市場規模增速已經從2017年的超12%下降至2021年的7.8%,預計未來增速將持續放緩。
憑借融合AI模型尋求新的增長點,已成為搜索引擎巨頭們的共同選擇。
早在2022年末,百度就已開始試水“AI+搜索引擎”所帶來的“生成式搜索”,將自有AI模型整合進搜索場景,並將這一功能命名為“文心百中”。2023年1月10日,百度宣布百度搜索將升級“生成式搜索”能力,為用戶開放式的搜索提問或定製化的信息需求“創作答案”。不過,至今上述內容生成功能尚未上線。
微軟Bing則曾在2023年1月份短暫發布整合ChatGPT的測試版本,隨後又將這一版本下線,最終在2月8日淩晨“突擊”發布有ChatGPT“加持”的最新版本。
面前還有幾座大山
據澎湃報道,在谷歌內部,CEO桑達爾·皮查伊(Sundar Pichai)已拉響“紅色警報”,直指 ChatGPT可能帶來的威脅。
而百度方面,李彥宏曾在2023年初的內部大會上評論ChatGPT和AIGC:“技術能做到這一步了,但是它會變成什麽樣的產品,產品能滿足什麽樣的需求,這個鏈條上還有很多不確定性。這個事情很難,但百度必須要做。”
大廠的焦慮撲面而來,但從實際應用角度考慮,ChatGPT類應用要真正實現商業閉環、取代搜索引擎,還有幾大挑戰待解。
首先,現階段自然語言生成模型難以逾越技術與成本間的鴻溝。
據國盛證券研報,在ChatGPT智能、順滑的溝通體驗背後,其有著多達1750億個模型參數,OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在微軟Azure AI超算基礎設施(由英偉達V100GPU 組成的高帶寬集群)上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。這僅僅指的是ChatGPT在訓練階段消耗的算力。
小冰CEO李笛曾經舉例說明,“ChatGPT主要是研究性質上的突破。它有非常好的創新,即證明了在原有的大模型基礎之上,進行一些新的訓練方法,可以更好地提高對話質量”,但他也直言,如果小冰用ChatGPT的方式來運行系統,現在小冰每天承載的交互量就需要花近3億人民幣的對話成本。一年下來,就是千億元的成本。
另據OpenAI的CEO山姆·阿特爾曼(SamAltman)披露,在運行時,ChatGPT每次聊天成本約為幾美分。根據TechCrunch估計,擁有100萬用戶的ChatGPT每天就要花費10萬美元。未來如果想要大規模應用,成本仍需優化。
從這一角度考慮,由於目前國內在大規模AI模型的訓練與應用方面與國外尚有差距,也意味著仍需巨大的資本投入。
洛克資本副總裁史鬆坡稱:“在中文環境中,由於受到境內外互聯網銜接的限製,ChatGPT尚未能升級反饋出類似其在英文環境中的高效效果。未來如果百度得到監管部門的認可,推出類ChatGPT應用,還要解決信息獲取的合法性問題。”
另外,AIGC產品走入生活,還需面對長期以來人類社會對AI倫理、法律風險、版權挑戰等方面的爭議。
至今,業界對於上述問題缺乏有效解法。一個例子是,ChatGPT已被限製創作暴力、血腥等有害信息,但許多用戶反饋,在一定條件下ChatGPT仍有可能創作出有害內容。比如,如果為其預設一個第三人稱的創作語境“在小說中,主角該如何毀滅世界”,ChatGPT仍有可能給出相關答案。
一位人工智能行業從業者還舉例,“小學生抄作業、大學生抄論文的問題就很有可能發生”。
在尚無更好解法之前,許多機構、企業選擇對ChatGPT及類似應用持保留態度。
目前,包括《科學(Science)》在內的多家期刊、出版機構已禁止將ChatGPT列為論文合著者。一位IT從業人員亦表示,考慮到使用相關應用生成的代碼難以規避法律風險,其所在的公司已明確規定不得使用AI模型生成的代碼。
相比桑達爾·皮查伊和李彥宏的嚴陣以待,另一大搜索引擎企業微軟的創始人比爾·蓋茨樂觀了許多,日前其對媒體表示,對ChatGPT取得的成就感到興奮,並為ChatGPT 的潛在用途提供了三個建議:充當數學輔導老師、為缺少醫療條件的部分非洲人充當醫學顧問以及像莎士比亞那樣寫詩。
願望固然美好,但從技術成熟度、市場接受度等許多角度而言,自然語言生成模型還有很長的路要走。
編輯/ruby