來源:極客公園
作者:李曉蕾
在中國,有超過八成的人在生產或消費短視頻內容,上網的人們平均把三分之一的時間都花在抖音、快手、視頻號等平台上。幾大平台用過去幾年的時間,修築了一條通往海量中國用戶的高速公路。這樣的影響力顛覆了生產和消費內容的方式,也逐漸在商業領域中成為基礎設施一樣的存在。
短視頻與直播,除了在電商領域匯聚了核爆般的影響力,也開始對更多的行業產生影響,甚至滲透到一些從未被傳統互聯網改造的角落。
快手的藍領招聘和直播賣房、抖音的本地生活服務、微信視頻號的泛知識傳播、Bilibili(後稱 B 站)的虛擬主播……極客公園觀察到,大型平台公司都在不斷伸出觸角,在新的行業尋找商業的可能性。短視頻和直播平台所輻射的範圍早已超過了用戶的娛樂場景,開始展露出「殺時間」以外的商業價值潛力。
這些業務未必成熟,在 2022 年才初露鋒芒,需要更久的時間才能深入滲透到行業,並得到最終成功與否的驗證。
但我們仍然向多位創業者、業內人士發起了探討:直播、短視頻行業正在對哪些領域發起商業效率改造?這段征程的挑戰是什麽?在增長與紅利幾乎見頂的互聯網,有哪些新的商業變量和技術變量,並因此將產生怎樣的機遇?對於從業者而言意味著什麽?
一個現實是,短視頻與直播領域已進入存量時代,接下來,如何將巨大的流量池與細分賽道結合,重構更高的商業效率,是下一階段更值得思考的議題。
五年時間,修築一條
通往海量用戶的高速公路
細數短視頻行業的真正爆發,是從 2017 年開始的。
此前一年,抖音正式發布,潮流的歌舞表演、風格化的濾鏡,再加上可以猜測用戶品味的推薦算法,使抖音最先吸引了一二線城市的年輕用戶。而此時的快手在剛剛過去的 2016 年里,終於完成了從工具到短視頻社區的轉型,突破了 4200 萬 DAU(日活躍用戶數量),在以東北為主的下沉市場用戶中成功占領了心智。
平台(以快手、抖音為首)對短視頻產品低至 15 秒的時長要求、大量可供選擇的短視頻拍攝製作工具,再加上智能手機的普及、流量費用的逐漸降低,共同降低了短視頻拍攝和消費的門檻。而在創作生態層面,抖音從今日頭條沿襲來了商業化廣告客戶、創作者變現機製,快手則上線了直播打賞功能,這些都成為了內容創作者們變現的重要渠道,創作者生態憑此崛起,短視頻真正開始在更廣泛的人群中流行起來。
到 2020 年,每天使用抖音的人超過 6 億,使用快手的人達到 2.6 億。在這樣的大背景下,微信視頻號誕生不到 2 年時間,日活就超過 4 億。嚐試了十餘款短視頻產品的騰訊終於有了一款可能與抖音、快手產生製衡的產品。而從二次元社區轉型而來的視頻網站 B 站也顯現出強勁的增長勢頭,靠著招牌式的跨年晚會完成一次次的破圈,截至 2022 年 9 月,月均活躍用戶已超 3.3 億,日均活躍用戶達 9030 萬,最高紀錄每人每天觀看 96 分鍾。
幾年時間,幾家頭部的視頻內容平台完成了海量用戶的聚集和留存,並成為影響力最大的媒介。根據最新的數據披露,抖音日活已突破 7 億、快手為 3.47 億、視頻號 2022 年 3 月已超過 5 億。而 QuestMobile 2022 年 6 月的數據顯示,短視頻用戶時長已經超過微信、QQ 等即時通訊產品的用戶時長。

頭部短視頻平台已經完成規模化用戶累積
面對中國這個統一的大市場,海量的用戶,相同的文化和語言,再加上數據算法的成熟,平台擁有了觸達用戶的高速公路。這幾年的規模化發展,也讓各個平台在算法、技術上得到快速積累,內容與用戶之間能更精準地匹配。
在此背景下,抖音和快手不斷放寬平台上的視頻時長要求,從 15 秒到 1 分鍾,再到 10 分鍾甚至更久(今天的用戶可以在抖音上看完一整部電影),並在直播功能與場景上做不斷細化——這意味著,短視頻所能承載的內容越來越多且廣泛。短視頻和直播平台所輻射的範圍早已超過了用戶的娛樂場景,開始展露出「殺時間」以外的商業價值潛力。
但與此同時,短視頻用戶增長幾乎見頂。抖音、快手、B 站不斷深入對方的領地並試圖繼續滲透市場,下沉市場、老年用戶,未被短視頻占據的荒地越來越少。抖音和快手這兩個早期完全不相同的產品,面臨的目標市場也愈發統一,用戶重合率從 2018 年的 10.3% 攀升至 2021 年的 60%。這意味著,以用戶留存和占領市場為主要目標的純規模擴張已經告一段落,接下來,如何將巨大的流量池與細分賽道結合,重構更高的商業效率,是下一階段更值得思考的議題。
於是 2022 年,擁有對五環外市場最大影響力的快手,首選了藍領招工,作為以直播方式切入傳統商業世界的起點。
而抖音則選擇切入本地生活——事實上,抖音的用戶畫像與本地生活平台的主流用戶高度重合。QuestMobile 數據顯示,一二線城市 35 歲以下人群是本地生活的消費主力。而抖音用戶中,超過 60% 的用戶分布在一二線城市,71% 的用戶都在 30 歲以下。
對商家而言,無論是選擇線下的高流量店面,還是參與到團購網站中,都是在尋求流量。而抖音依靠公域流量、千人千面的算法能夠決定用戶所能看到的內容,使精準匹配用戶需求有了可能性。
短視頻與直播,
更細節、可信、高效
如果將公眾號、信息流廣告時代,圖文消息為主的信息稱為二維內容,可以容納文字、圖片、聲音、影像,呈現立體現實空間的短視頻則已過渡為三維內容,直播則在短視頻的基礎上,增加了時間軸,形成四維空間的內容。
三維、四維的內容夾雜著豐富的信息,帶來了無限細節的價值,也能通過場景、空間的延伸,實時的互動,傳遞更加細節、可信、高效的信息。這種特性也幫助短視頻和直播能在更多商業領域中發揮作用,一定程度地提升效率。
比如過去幾十年間,工廠招人需要先向人力資源公司發單,再由中間層層代理逐級傳遞。一些不良代理為了獲取信任,常常誇大宣傳待遇,虛報工資。傳統套路是先說虛高的工資,發薪時再設置障礙,以未達到要求為由扣除工資。一家國內頂級工廠招聘負責人提到,過去,光是工人住的是幾人間,這個問題就遇到過不少投訴。
但在「快招工」(現更名為「快聘」),通過短視頻和直播的方式,主播能更直接地講解崗位招聘要求之外,用人企業生產的產品、車間生產環境、住宿環境等都得到了直接的展示。

快聘界面,主播直播背景正輪流播放工廠環境視頻,投遞簡歷僅需電話及年齡
相比文字、圖片,短視頻和直播讓信息有了更多維度的展示,更容易讓求職者了解更多細節。直播的實時性和交互性也可以在藍領求職者遇到疑惑時,得到最快速有效的解答,承諾的招工條件也有直接的保證。
另一個更直觀的行業是本地生活。
事實上,大眾點評的出現,已經讓一個店鋪的內容呈現體系得到更豐富的呈現。餐廳的菜品特色、環境、位置、用戶的圖文評價、均價等信息均囊括其中。但比起靜態的內容,抖音所代表的本地生活服務,則提供了另一種更動態和更具沉浸感的環境和菜品、氛圍展現。
比起評價一個餐廳風格「文藝」,視頻或直播畫面中 ins 風格的餐廳布置、菜品的擺盤,就餐時具有沉浸感的畫面,再加上直接綁定的可供購買的套餐,也讓篩選變得更加容易。
而在細節的具體呈現之外,直觀溯源也是短視頻、直播所具備的一大優勢,一位在身份上足具說服力的主播,能夠直接對成千上萬名(甚至幾百萬)在線觀眾傳遞信息,並能做到實時互動,這對於建構起一個互信的環境是更有利的。
過往的藍領招聘中,負責傳遞信息的人往往是農村的 KOL,如村支書、村支書的兒子,或者上一批靠外出務工賺到錢的同鄉——他們在身份上具有公信力,但每個人所能輻射的範圍有限。市場上大量人力資源招聘、勞務派遣的企業機構(以 58 同城為代表)需要找到這些 KOL,將他們納入招聘的利益鏈條,而由於鏈條過長、且主要依靠口耳相傳,信息的準確度和真實性始終難以得到完備的保障。
即便是在後期互聯網招聘渠道上,也一直存在因無法溯源而導致的被欺騙和詐騙的問題。面對魚龍混雜的信息,藍領工人沒有判斷能力,也沒有谘詢渠道。
而直播招工則像是在直播間開設了一個公開的招聘門店,公開意味著透明。主播必須要靠跟粉絲、觀眾之間構建信任關系,除了收集求職者信息、匹配崗位之外,在直播中承諾的薪資待遇、談定的工廠工種都需要做到信守承諾。否則這個公開的門店招來惡評,就無法長久地經營下去。
比起層層代理,直播可以進行更系統的管理,為商業環節降本增效。對於許多中間環節多、容易出現信息漏鬥的行業均是同理,短視頻與直播間提供了足夠豐富的細節可以增加信息度之外,可記錄、可追溯,在能保證統一的標準傳遞信息時,進一步打造了信任體系。
此外,短視頻與直播的方式突破了時間、空間的限製。專門從事人力資源招聘的山東格領集團,其總經理張軍解釋稱,過去他們招工靠的是人尋人,需要在線下以店面的形式地推,從市、下到縣,再到村。而依賴短視頻平台的流量推薦機製,可以更精準地觸達目標人群。
收集信息的效率也得到了提升。張軍提到,過去一年能收到 20 萬份簡歷已經是不錯的成績,但 2022 年的前 10 個月里,他們已經收集到了 100 萬份簡歷,而且用了相比過去更低的成本。
歌爾在經過將近一年的快聘嚐試後,算了一筆賬。在刨除快手用工成本、招聘成本後,每個工人每工時的人力成本減少了 1 元錢,按 1 天 10 個小時算,一個人一年就能省下 2000 多元。要知道,歌爾在用工忙的 5-7 月時,共計招聘了 5 萬人,其中 5000 多人從快手招來,相當於省下了 1000 萬元。
更便捷、更快速、有效地傳遞信息,招聘培養的成本和時間大幅收縮,企業招工、管理成本自然下降。這樣的新渠道吸引來了諸如富士康、歌爾、美的等企業,根據快手財報,截至 2022 年第二季度,快聘月活用戶規模達到 2.5 億,已與 10 萬家企業達成合作
短視頻營銷,
更徹底的心智塑造
區別於傳統搜索和 LBS(Location Based Services,圍繞地理數據展開的服務)的信息分發方式,短視頻平台的主動推薦使得用戶被動種草——這吸引了大量品牌,開啟了全新的營銷思路和品牌戰略。而抖音用戶年輕化的特性也使得這一戰場的優勢更為突出。在本地生活服務方面,一批餐飲、酒旅商家已經完成了在短視頻平台從營銷到交易的閉環。
相較傳統的渠道,抖音的廣告有更加立體的呈現。懂得抓住這一點優勢的商業機構,已經打造出屬於自己的 showcase(招牌案例)。
以 CoCo 為例,這是一個有著 25 年歷史的奶茶品牌。最近幾年,由於中國飲品行業競爭加劇,老將品牌也不得不持續推陳出新。2022 年夏天,CoCo 曾推出一款結合咖啡元素的生椰珍珠拿鐵,但所有渠道的售賣都並不理想(此前 CoCo 最優勢的品類是珍珠)。這是一款有著三層明顯顏色分界的飲品,奶白椰子、深咖拿鐵再加上厚厚一層黑色珍珠——利用這個「好看」的特性,CoCo 的抖音服務商金麥眾合開始邀請美食達人進行短視頻種草,再開直播集中交易,種草和交易環節打通後,這個曾經並不暢銷的新品在一場直播中賣出了 20 萬杯,這相當於一家 CoCo 線下門店一個月的銷量。
多位抖音服務商均提到,抖音上的商品需要抓人眼球,契合年輕人的審美,這就要求商家、服務商群體在內容上下功夫,抓住抖音善於曝光的特性。
突破地理空間限製的分發模式、及重視內容曝光的特質決定了,短視頻內容的影響力、交易的規模化效應,在轉化成交之外,也可以為企業自身的品牌宣傳作出貢獻。
金麥眾合 CEO 花蕾告訴極客公園,CoCo 的直播並不以銷售轉化為第一目的,而是希望傳遞品牌的年輕化主張,被年輕人重新記起。正因此,CoCo 在抖音不做叫賣式的直播,而是通過類似微綜藝的方式,加入談話、唱歌等活動。
一位探店達人總結:在抖音鋪設內容就像是一個在互聯網發傳單的過程,每個用戶刷過視頻,就是被動接到了一張來自商家的廣告傳單。
拿火鍋頭部品牌海底撈來說,海底撈有自身很強的品牌屬性,拉新訴求較弱,年輕用戶占比和私域經營在餐飲中屬於頭部。但在大眾點評等幾乎沒有設置團購套餐的海底撈,卻把團購券搬上了抖音。接近海底撈的人士告訴極客公園,他們在抖音的訴求是,讓冷門的店鋪通過抖音這個新渠道做熱,讓新開的門店快速獲得人流,以及讓海底撈新菜品、夜宵等特色服務被更廣大的用戶知曉。
抖音的內容推薦邏輯扭轉了過去主動搜索的行為,達成用戶被動種草的效果——先購券再到店消費,這種信息的流通轉變讓新品、新店、新玩法可以得到更快速有效的曝光,從而影響到用戶的消費行為。
而據極客公園觀察,在大眾點評等本地生活服務平台,商家的參與更偏向單一門店行為,營銷動作的最終指向通常為絕對的銷售轉化,是否有團購套餐、套餐涵蓋種類、價格,不同門店各不相同。而品牌在抖音的嚐試則常常是集團行為,售出的代金券全國門店均可核銷,且策略通常重在打造品牌、建立用戶認知。
流量之外,還未完全
實現的操作系統價值
前文描述了,在用戶規模、內容生態、產品技術都已經足夠成熟的今天,利用新形態的優勢切入更加細分的賽道似乎順理成章,且在早期的流量紅利市場下能夠很快收獲正反饋。但想要達成新的迅猛的增長,又不止於這些要素,而有賴於一個更完備的基礎設施操作系統,也需要重新構建起服務具體新業務的能力。
過去一年剛剛完成瘋狂擴張的抖音本地生活,一邊規模覆蓋城市,一邊拓展業務線,展露出更大的決心。但不得不承認,進入行業 5 年,正式成立一級業務部門才 2 年的抖音,在整體的服務設施上還存在明顯短板。
比如抖音在本地生活中的酒旅板塊,至今還沒能為商家提供完備的服務系統。多位熟悉酒旅行業人士均提到,抖音產品側目前存在最大的問題是無日歷房、日歷票(一種 OTA 平台上訂購酒店或門票時出現的日歷選擇功能)。目前來說,抖音售出的酒店及門票,仍需要通過第三方 SaaS 工具,或通過其他渠道進行具體日期或商品的轉換——這意味著,不同的價格、類型(有無早餐等)均需要上架單獨的 SKU,這就導致,一個大型酒店在抖音可能需要 30 個 SKU 才可能滿足所有房型的需求。
一位抖音本地生活服務商稱,核銷體驗的斷點,訂房和票務系統的鏈接不順暢,導致商家有大量的酒旅類團購套餐無法直接上架到抖音。
本地生活板塊中,極為重要的「到家業務」也是抖音仍然缺失的板塊。配送上只能依靠第三方,如達達、順豐同城、閃送等完成。
鑒於本地生活行業有海量中小商家,且散落在中國各個角落,想要規模化地影響這個行業,需要一整套能真正提升行業效率的商家基礎服務設施。但線下商戶多而雜,此外,餐飲、酒旅、麗人美妝、按摩等各分支所需要的服務也不盡相同、短時間搭建一個可以適應所有本地生活商家的服務系統並非易事。
今年 4 月,抖音上線了商家內容營銷平台「來客」,聚合了商家的經營數據、待辦事項和營銷推廣需求,本質上是一個商家與達人、服務商對接,及商家運營的管理平台。但目前店鋪、粉絲的運營都十分欠缺,追蹤拉新率,復購率、粉絲畫像等數據仍然未開放給商家。
對比來看,大眾點評花了 19 年時間,構建起一整完整的商家服務體系。星級體系和評價系統之外,大眾點評還有流量投放、數據工具「開店寶」,必吃榜、熱門榜、黑珍珠餐廳等榜單體系,此外還有秒殺&立減、免費試(霸王餐)、推廣通等平台向的活動為商家提供流量入口。
一位酒旅行業人士說,過去攜程、飛豬、美團為首的企業,經過多年的激烈競爭,最終產物是為文旅產業提供了保姆式的服務,「把商家做懶了」。例如廣州長隆集團,攜程對旗下每個酒店都有專人對接,為各個促銷節點提供政策、營銷內容、方式。商家只需要提供產品及服務,其餘產品上架、營銷等多數時候由平台代為運營,平台還會提供階段性大促的產品共創及包銷策略。
所謂產品共創及包銷策略,指的是平台會與商家共創酒旅套餐,並預估提前預付給商家一部分銷售額。
可見,在商戶和消費者的供需兩端中,美團、攜程等平台抓住的是商戶——當供給又豐富又全時,自然能很好地滿足用戶主動搜索的需求。而抖音的運轉則以內容為核心,抖音不打算走美團、攜程等平台的道路,而是試圖重構一套規則:以內容吸引用戶並激發用戶消費,進而使商家與平台共贏獲利。
一位服務商總結,只有滿足「新、奇、特」——小眾、高端的酒店,有特色的酒店自助餐、特色私房菜等產品才具備在抖音上爆火的基因。
但這樣的策略對商家而言,意味著更大的運營成本。傳統的酒旅商家想要轉型到抖音:平台產品上下架、產品編輯、承接更海量谘詢的客服團隊、短視頻與直播的內容運營、引入第三方 SaaS 票務預定系統、營銷工具等——這些過去在 OTA 平台不必經歷的事都需要重新著手做一遍,同時,商家也需要一支更能適應和理解抖音規則的運營團隊。
多位參與抖音本地生活的人士均提及,抖音需要品牌有長期的內容營銷方案,而營銷的成果依賴於更好的服務商和達人體系——這類支出都不便宜。也正因此,大型的樂園集團多把抖音當成促銷渠道,而不是日常運營渠道。
相比傳統 OTA 平台為商戶提供保姆式的服務,抖音希望以「DP(Douyin Partner)服務商」的引入,打造一片「做大蛋糕」的生態。2021 年,這些服務商曾為抖音貢獻了超過一半的電商 GMV。去年 5 月,抖音將「DP」引入本地生活服務商,讓服務商成為抖音連接本地生活商家的毛細血管。
在 DP 機製下,服務商與抖音共同拓展商戶、負責幫助商家做好短視頻內容、直播的運營,為商家做內容創作及交易轉化。2021 年年底開始,針對 KA 及 SKA(重點商家和高級重點商家)客戶,各服務商需提供具體方案、參與競標,最終的價優方案好的優勝者才可以獲得代理權。而對中小商家而言,「來客」就是與達人建立聯系最關鍵的橋梁。
電商服務商們吃到了早期的紅利,不少服務商看中本地生活在抖音還是藍海,參與者紛紛湧入,一年時間過去,抖音在全國各地吸納了超過 1000 家服務商。以食物主義、金麥眾合、樂淘互娛等為代表的服務商隨之崛起。
但如果將目光放得更長遠,一旦平台扶持與流量的紅利期一過,寄生於平台的服務商還是否會留存?(這取決於增長能否持續以及服務商能否賺到足夠多的錢。)而對於商戶而言,刨去早期入場的紅利,高成本帶來的內容營銷轉化效果是否經得起商業價值的考驗?
投入到新業務的參與者多數看中業務早期帶來的紅利。在互聯網的發展歷史上,幾乎每個平台都有流量紅利期。在早期,美團等平台也依靠補貼商家、補貼用戶,投入大量的金錢做推廣,讓早期的商家嚐到了好處。但當紅利期消退,是一個更標準化、可供商家更高效經營的系統留住了這波合作夥伴。
一個美團商家,只需要做好線上門店的設計和信息同步、上線團購套餐就完成了運營的大部分工作,但在抖音,日常化的運營,尤其是內容的運營對中小商家有更大的挑戰——主要還是體現在成本方面。據業內服務商透露,目前,全國連鎖店鋪營銷加內容的成本大約占比營業額的 5%-10%,但小品牌則高出不少,通常占比 8%-15%。
高昂的運營成本能否帶來足夠合理的回報,這一點仍然未被證實。
而從旅遊業、餐飲業、支付業等轉行而來的服務商們都對極客公園表示,「抖音 2-3 年內比美團的運營體系做得好是不可能的,但有流量紅利的時候(服務商們)都可以容忍缺陷,相對流量來說,運營的麻煩算什麽?」
但當流量紅利消失呢?
同理,快聘面對的藍領招聘市場,一直呈現小而分散的特點,在中國還未能有企業真正拿下這塊市場。盡管藍領招聘的整體用戶規模達到了 4.26 億人,但線上化率卻僅僅到 5%(2130 萬人)。
對快手而言,光是解決流量、利用算法高效匹配供需關系——這只做到了信息的中介作用。現階段為平台扶持期,快手既要有人來做更細致的運營和幫扶,另一邊也要給出足夠大的流量扶持和激勵,解決供需量以及匹配的問題。但光是這樣還遠遠不夠。
快手必須在 Boss 直聘、58 同城等招聘平台對藍領招聘市場的進擊下,不斷提供更豐富的企業職位供給。
對於用工企業來說,快聘真正有想象力的變革在於,藍領招聘傳統渠道堅固,能提供更大量工人的勞務派遣機構有絕對話語權,派來的員工企業無法篩選,只能將人放至不同崗位。快手這樣的新渠道出現後,當前解決了流量的問題,長期的價值在於保證這個渠道招聘的穩定性,且成本不會大幅度提升。
快手需要做的,就是通過產品機製、平台特性更好地解決匹配精準度、信息篩選及後期的用人服務。這同樣需要更深入產業鏈條,並再深化用戶操作系統的價值。
前沿技術
帶來新的應用機遇
底層技術的演進必將帶來相應的商業變革。極客公園經過大量的梳理和訪談發現,在直播和短視頻行業,幾類前沿技術的進化正掀開新的應用機遇和商業現象。
AIGC:降低用戶創作門檻
2022 年,AI 生成繪畫有了大量產品出現。基於深度學習(Deep Learning)技術快速發展而誕生的文本生成圖像模型 Stable Diffusion 發布,它以完全開源的方式,讓普通人接觸最尖端 AI 技術的門檻因此被降到最低:開發者紛紛接入、部署自己的生成模型,海量的文本生圖產品出現;用戶們只要打開網址、App,輸入想要畫面的關鍵字,等待幾分鍾,AI 就會自動生成完成度非常高的圖片作品。
隨著此類擴散模型的開源,催生了大批創業公司,過去一年,AIGC(Artificial Intelligence Generated Content,用人工智能技術生成內容)成為投資大熱。它被視作是緊接 PGC(專業內容生產)、UGC(用戶內容生產)之後,一種新的內容生產方式。
據極客公園的不完全統計,在 2022 年,在中國至少有 15 家拿到新融資的 AIGC 相關企業,紅杉中國、高瓴資本、DCM 創投等一線機構均有出手。多家短視頻平台的高層也開始研究 AIGC,探尋是否存在技術帶來的新機會。

2022 年獲得融資的 AIGC 相關企業
追溯來看,AIGC 早早就在短視頻直播領域有了基礎的應用。
2017 年問世的 GAN(Generative Adversarial Networks,對抗生成網絡)模型在人臉識別上有了很大進步,抖音、快手也在通過 GAN 模型生成特效濾鏡供用戶拍攝視頻使用,例如曾在抖音風靡的讓不笑的臉變笑、人臉的轉換等。基於新的 Stable Diffusion 模型,抖音、快手也同樣很快就被應用在特效濾鏡上。今年中秋節,抖音上線了一款基於擴散模型的視頻模版「中秋夢境圖」,可以通過用戶所處背景的特點,生成與月亮相關的、不同的動畫圖像。
AIGC 相關的技術,早就悄無聲息在很多日常的內容生產中應用,只是還未有今年的名氣。在剪輯軟件中被廣泛使用的自動提取語音轉換字幕功能,同樣也被歸為 AIGC 的其中一類。此外,在短視頻平台上,已經有批量由 AI 剪輯的影視視頻。
(一位算法專家解釋,這類視頻雖然是 text-to-video 的落地,但不是完全的 AI 創造。內容的生成大多依賴背後的視頻庫,視頻庫里面有海量的片段,AI 需要做的是根據文案,匹配相應的畫面,再對片段的短視頻進行拼接,再由 AI 配音。)
可以肯定的是,AIGC 的應用遠不止於此。極客公園了解到,抖音、快手都在研究 AIGC 相關的智能創作。未來最成熟的 AIGC 技術,必然是在文字、圖像、音頻、視頻、動畫等之間的多模態轉化。
AI 繪畫的走紅,讓人們意識到 AI 技術在純文本轉圖像方面有了飛躍進步,按照正常的推演,視頻正是由海量的圖像畫面組成,看起來下一步就將是生成創造視頻內容。
不過,AIGC 距離能夠影響視頻內容的生產,還有很遠的距離。
就多模態生成視頻來看,目前最前沿的三個平台 Google ImagenVideo、Google Phenaki、Meta Make-A-Video 仍然有各自的問題,例如幀率過低導致畫面模糊,動作不流暢、分辨率過低、假影、噪音等。比起生成圖像,視頻的難點在於處理時間與空間的信息,視頻運鏡、場景轉化等,現有的技術、模型仍然不能很好地識別 3D 空間。

現有最前沿的多模態視頻生成平台及特點 |受訪者供圖
AI 繪畫產品 Tiamat 創始人青柑提到,生成視頻還面臨不少的基礎問題,以像素為例,一個清晰度在 1080p 的視頻對算力的要求很高,成本也很大。早期他們曾通過現有的模型和算力生成一個時長 3 秒的視頻,光是渲染就用了兩天。
一方面,現有的訓練模型在文本生成圖像上仍然面臨理解或生成不準確的問題,另一方面,現有的技術還需要持續突破才能支撐視頻內容的生產。
另一個挑戰在於視頻生成的數據量過於龐大,難以處理。這些圖像如何更高效地在雲端儲存,如何整理、分發都是實際的問題。以現在的 AI 繪畫產品為例,DreamStudio 自上線以來(截至 2022 年 10 月),製作的生成圖片就超過 1.7 萬億張。可想而知,如果 AI 能生成視頻,平台的運營成本也將是一個不小的難題。
多位從事 AIGC 相關行業的人均認為,AIGC 最終是輔助工具,而不能替代內容的生產。今年公布兩輪融資的慧夜科技,已經可以利用虛擬人及 AIGC 技術為合作品牌低成本生產 3D 內容,據了解,一家合作商依賴他們提供的 AIGC 的工具、通過虛擬人生產內容素材,符合質量的內容成本減少 20%-30%。慧夜科技創始人渠思源認為,目前的 AIGC 技術對專業人員來說可以優化創作成本,AIGC 的想象力不僅在於降低內容生產成本,更在於降低門檻,讓更多沒有相關技術的人可以通過成熟的工具參與到內容創作中。「AIGC 的工具提供的是一個虛擬內容表達和可視化的窗口,相當於為每個人都提供了一個虛擬世界視頻創作的攝像頭。」
另一位短視頻平台技術專家則認為,AIGC 未來會越來越工具化,成為「創作素材的靈感 ATM」,幫助設計師、內容生產者低成本地提供海量的素材參考。此外,在多模態語言、3D 內容、圖像視頻編輯上,很快就會有不錯的應用出現。
國內一家 AI 技術公司創始人預測,AI 未來會承擔更多生成及承擔更多輔助生成的作用,多模態生成內容、創作者工具可以重新再做一遍。與此同時,AIGC 最大的問題在於生成內容不可控,如何做協作模型,通過人的反饋促使機器快速學習或糾正,可能是一個很大的趨勢。
虛擬人技術:虛擬直播的商業空間
2018 年,VTuber(虛擬主播)月之美兔在日本掀起了虛擬直播的風潮,此後,專職推廣 VTuber 的經紀公司在日本興起。根據月之美兔所屬的經紀公司「彩虹社」的財報數據,今年 2 月到 7 月,靠著旗下 138 位虛擬主播,彩虹社營收達到 99.36 億日元(約合人民幣 5 億元)——盡管絕對值不高,但營業利潤接近 1/3。

初代虛擬主播月之美兔,YouTube 粉絲 98 萬|來自 YouTube 截圖
虛擬直播是否是一門好生意,開始引起了更多人的思考和關注。在 YouTube、B 站、抖音、小紅書等內容平台上,越來越多的虛擬人成為內容的主體。
B 站是國內虛擬主播生態最為成熟的平台,2017 年,B 站第一個虛擬 UP 主「小希小桃 Channel」就已誕生。隨後幾年,B 站虛擬主播數量保持著每年三倍左右的速度增長。根據 B 站提供的數據,2021 年上半年,B 站虛擬主播數僅為 3.6 萬,到 2022 年 10 月,這個數字躍升至 23 萬。
一方面,動作捕捉技術和設備逐年進化,市場上也出現了第三方的動作捕捉技術提供商,另一方面,技術的進步正在降低成本。按照第三方平台向極客公園提供的報價標準,一套全身捕捉的硬件設備+軟件服務一年的售價在 2 萬元左右,僅需要面部捕捉則只需要 5000 元每年。索尼在 11 月末發布的便捷動捕設備 mocopi,已經進化至僅由六個 3.2 厘米傳感器組成,佩戴後連接智能手機就可以創建虛擬世界的自己,售價僅 49500 日元(約合人民幣 2568 元)。

將 mocopi 分別安裝到頭部、雙腕、臀部和雙腳踝,連接智能手機即可進行數據采集和動作輸入|圖片來源:索尼官網
虛研社是國內第一批專職運營虛擬 UP 主企劃公司,其創始人張亮提到,早期因為技術原因,一個虛擬人從設計到推出,需要 20 萬,到 2019 年左右,便宜的話 3000 元就可以做出一個虛擬人。幾年前的動捕設備還是專業電影特效中常用的慣性動捕、光學動捕,到現在,手機攝像頭就可以完成動作捕捉。
平台也在搭建可供素人便捷開啟虛擬直播的基礎設施。
B 站虛擬主播業務負責人噶嗚提到,最開始製作 2D 主播模型,成本最低也需要 3000-8000 元,對很多素人來說,嚐試成本過高。B 站提供了快速的入門工具,在開播軟件中預設虛擬形象,供用戶使用,門檻大大降低。軟件互動能力上,也把散落在海外開發軟件論壇的直播 OBS 插件,做了集成,讓用戶可以通過一個開播工具就體驗到基礎的玩法。B 站還在與不同的軟硬件供應商合作,力求為行業中的參與者把參與成本、精細化製作的成本降下來。
技術方面,人工智能的技術突破讓虛擬人在理解與表達能力、合成顯示、識別感知、 分析決策等方面得到提升,動捕、3D 建模等底層技術服務也在隨之發展,市場的活力逐漸被激發。再加上元宇宙概念的興起加速了行業進化,虛擬人得到更廣泛的應用,更多虛擬主播頻繁出現在直播間帶貨或表演,成為品牌代言人,正在逐漸變成重要的內容介質。
整體來說,動作捕捉、攝像頭等硬件設備的進化,使得早期僅供娛樂的虛擬偶像,有了更多現實應用的可能性。SaaS 工具、動捕設備、3D 建模工具、虛擬人內容製作等仍然可以通過改造效率找到市場。
交互技術:讓用戶更沉浸
外界復盤抖音的崛起時,必然會提及豎屏視頻鋪滿屏幕,給用戶帶來了忘記時間的沉浸感。視頻內容的競爭發展到今天,無論是愛奇藝、優酷、騰訊視頻這樣的長視頻平台,還是抖音、快手、B 站,都在探討如何讓用戶獲得更沉浸、逼真、立體的觀看效果,以及如何引入更多的交互,讓短視頻與用戶間能有更多維和豐富的互動。
愛奇藝與優酷這樣的長視頻平台,在 2021 就引入了觸覺交互效果,當影視劇中的人物有強烈的心跳時,觀看設備會同步震動,模擬出同樣的模式。這樣的交互依賴手機中的馬達,在應用到實際場景時,電子設備中的馬達能提供的互動場景並不止於此。
例如,視頻可以解析出視覺和音頻代碼,基於此可以與內容開發商合作,將觸覺算法植入後台,處理後生成匹配場景的觸覺代碼,在本地識別、解析再輸出觸覺效果。對抖音類短視頻內容,可以基於後台音樂庫做聲音到振動的轉化,生成匹配音樂內容的觸覺代碼,再加入到背景音樂中,讓背景音樂可以與硬件設備達成交互;另一種可能性在於,對基於現實生成的視頻內容進行觸覺增強。比如說,用手機錄製煙花、爆竹類視頻,在某地拍攝,獲得音頻信號,再將參數映射到系統馬達上,在觀看視頻的設備上,通過馬達就可以做出同等的效果。
在硬件端,寬頻馬達已經被證實可以獲得細致的交互效果。在VR設備上,在釣魚場景中,已經可以感受到水流的震感,還原魚兒上鉤各個階段,拖拽魚線的力量變化。
但目前的挑戰在於,硬件端、內容端與馬達軟硬件提供方,三方尚未展開極其緊密的合作。尤其是,智能手機已經進入存量市場,新興的硬件只能出現在新設備上,存量舊設備的觸覺體驗只能依賴傳統的馬達震動。而對內容創作者而言,是否引入這種更好的觸覺效果來開發內容,更取決於硬件平台的態度。但這里確實有可能醞釀一種交互模式進化的新潮流。
曹洪斌認為,頭部客戶對寬頻觸覺和觸覺交互都有認知,但沒有形成對用戶的規模效應。就現階段而言,這種觸覺的交互更多應用在 VR 行業,遊戲硬件上。他檢索海外各大軟硬件平台後發現,蘋果在 VR 專利上有很深布局,產業發展的關鍵就在於這些頭部硬件廠商何時放量。VR 端的觸覺交互會隨著設備量的增長逐漸成熟,未來的機會在內容平台與各類硬件之間的打通,真正實現產業鏈之間的協同。
而在直播方面,一個明顯的變化是,騰訊視頻、B 站、視頻號等都在嚐試 360 度的全景直播(但還未擴大規模)。B 站虛擬直播業務負責人噶嗚認為直播就是追求一種身臨其境的實時體驗。今年上半年,B 站曾經做過虛擬人全景 360 度的直播,這對軟硬件設備都帶來了直接的挑戰。
虛擬人全景直播的難度在於,對場景的豐富程度要求更高,通常直播只需要渲染一個面,但 360 度的直播需要渲染 6 個面,對技能的挑戰也相應提升。需要渲染 6 個面,對技術的要求也相應提升。實際上,從虛擬內容製作角度看,除了對美術製作提出了更高要求,甚至需要在聽覺上——音樂、音效等創造更好的臨場感。
隨著 VR 硬件的成熟,未來,短視頻與直播領域必然會發生的變化是,內容需要提供更豐富和多元的交互維度。視覺上,人們對內容清晰度的要求會越來越高,這也會反向推導內容的創作者們拍攝和生產更高清晰度的內容。而在交互方面,聽覺、視覺與觸覺的想象空間正在被打開,技術的快速變革正讓短視頻與直播領域燃起火花。
編輯/lambor