文|光子星球 吳坤諺 編輯|吳先之
大模型浪潮下的互聯(lián)網(wǎng)行業(yè)暗流涌動,大家都在翹首以盼誰能率先跑出中國GPT。
百度、360、阿里、昆侖萬維、商湯、金山、科大訊飛......即使拋去高校國家隊和創(chuàng)業(yè)公司,已經(jīng)在大模型領(lǐng)域秀過肌肉的大廠也能拉出一張清單來。中國科技巨頭歷來喜歡追逐風(fēng)口,大模型的航海時代自然也不會免俗,但有那么一家巨頭卻很沉得住氣,至今未曾露出什么大動作。
作為早在2022年4月便正式亮出旗下混元大模型的騰訊,在計算機視覺、自然語言處理、多模態(tài)內(nèi)容理解、文案生成、文生視頻等多個方向均有所建樹,如今卻給外界一種"失聲"的感覺。
自今年2月起,騰訊在大模型領(lǐng)域為外界所感知的大動作僅有兩次,一是2月27日針對類 ChatGPT 對話式產(chǎn)品已成立「混元助手(HunyuanAide)」項目組,騰訊史上最高專業(yè)職級擁有者張正友為項目Owner;二是4月14日發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計算集群。
在友商紛紛下場展示實力與聲量,爭取在大模型時代獲取更多認(rèn)知,騰訊的失聲很可能是一部慢,步步慢。更有意思的是,騰訊控股自3月29日起便跌跌不休,以Naspers為首的大股東更是在持續(xù)減持,這興許也是資本市場對騰訊在大模型賽道失聲現(xiàn)狀的不滿情緒體現(xiàn)。
難道,騰訊還在"等風(fēng)來"?
"失聲"是表象
北上廣不相信眼淚,互聯(lián)網(wǎng)大廠只相信效率。即使是OpenAI這個不停燒錢的公司也會不時對外放出一些意見以及信息,在信息爆炸的現(xiàn)代社會中試圖短暫地獲取關(guān)注力,而騰訊也是如此。
我們不妨以2月27日為節(jié)點,從騰訊對外宣布的動作中尋找其大模型訓(xùn)練進(jìn)度的蛛絲馬跡。據(jù)光子星球不完全統(tǒng)計,騰訊自2月27日起至今的動作集中在三方面,一個是AI商業(yè)化應(yīng)用,另一個是視頻號,最后是政企合作。
細(xì)數(shù)下來,其實騰訊在各方面的動作并不小。除了分別于移動、聯(lián)通兩大運營商達(dá)成云計算方面的合作外,3月30日,騰訊發(fā)布AI智能創(chuàng)作助手"騰訊智影"。4月,騰訊在上海智慧車站前夕發(fā)布智慧出行汽車云,發(fā)布了據(jù)稱是國內(nèi)性能最強的大模型計算集群,還與字節(jié)跳動破冰,探索視頻合作。當(dāng)時間到了5月,騰訊微視面向頭部的抖音、小紅書與快手招募創(chuàng)作者,于5月9日發(fā)布了"開悟"AI開放研究平臺,更是開放QQ渠道為載體,讓AI繪圖工具M(jìn)idjourney開啟官方中文版內(nèi)測。
與率先發(fā)布通用大模型并展開應(yīng)用探索的諸位友商相比,騰訊的聲量雖小卻也談不上"安靜"。而且其中無論是"開悟"AI開放研究平臺、"騰訊智影"AI智能創(chuàng)作助、計算集群的發(fā)布還是Midjourney相關(guān)動作,其實都與大模型訓(xùn)練有不小的關(guān)系。
智慧出行汽車云是基于云服務(wù)以及AI訓(xùn)練的"車云一體"服務(wù),"開悟"本身是由AI Labs聯(lián)合王者榮耀項目組推出的,本身是借用游戲場景進(jìn)行AI訓(xùn)練的平臺;"騰訊智影"這款支持虛擬數(shù)字人、文本配音、智能 AI 繪畫、文章轉(zhuǎn)視頻的應(yīng)用本身也屬于大語言模型的功能范疇;Midjourney開放內(nèi)測是對AI原生應(yīng)用于C端落地的探索;高效的計算集群更是在大模型訓(xùn)練中不可或缺的基礎(chǔ)設(shè)施。
再往下深挖,這三個項目其實也分屬騰訊內(nèi)部不同事業(yè)群。"車云一體"屬于CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),"開悟"屬于IEG(互動娛樂事業(yè)群),"騰訊智影"應(yīng)屬于WXG(微信事業(yè)群),大模型計算集群分屬TEG(技術(shù)工程事業(yè)群),QQ的應(yīng)用探索屬于SNG(社交網(wǎng)絡(luò)事業(yè)群)。
這不免讓我們聯(lián)想到騰訊特色的"內(nèi)部賽馬"機制,這是在過去的騰訊業(yè)務(wù)線中,不同競品之間養(yǎng)蠱最后確認(rèn)勝者的流程。而光子星球自某位接近騰訊人士處獲悉,CSIG、TEG與PGC均在訓(xùn)練業(yè)務(wù)范圍內(nèi)的大模型。
但考慮到大模型訓(xùn)練極高的投入,內(nèi)部賽馬將造成更大的沉沒成本。因此,目前的"賽馬"現(xiàn)象更大可能是TEG統(tǒng)領(lǐng)全局,由各個BG提供語料以及數(shù)據(jù)集標(biāo)注,為各BG的業(yè)務(wù)線打造專屬模型,最后再通過知識蒸餾匯總到混元AI之中。
這樣的戰(zhàn)略布局好處很明顯,既可以最大限度調(diào)動全局并提供高質(zhì)量數(shù)據(jù)集,也能在長時間的模型訓(xùn)練中探索商業(yè)場景落地的可行路徑。但弊端也同樣顯著,大型組織架構(gòu)中各個BG難以相互配合,龐雜組織架構(gòu)難免的山頭林立也讓成果互通變得困難。
"我們最開始以為這是互聯(lián)網(wǎng)十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機遇。所以我們覺得(AI)非常重要,但這的確需要有很多的積累",結(jié)合Tony在騰訊一季度財報會議上的講話,騰訊在試圖對外解釋自己的"不緊不慢",但在各家發(fā)力開卷的當(dāng)下,未曾透露具體進(jìn)度的回應(yīng)總歸顯得有些蒼白。
不受待見的AI Labs走上風(fēng)口浪尖
無論最終騰訊通過田忌賽馬落地了多少個BG的大模型應(yīng)用,最終的目的一定是保證最頂端的"混元"能夠幫助騰訊在AI時代站穩(wěn)腳跟,甚至再現(xiàn)移動互聯(lián)網(wǎng)時代的社交輝煌。
于是,一直以來在組織架構(gòu)中顯得有些邊緣的AI Labs踏上舞臺,享受著最集中的資源同時也承受著前所未有的壓力。
這是因為,以騰訊AI Labs以及阿里達(dá)摩院為代表的大廠AI研究實驗室通常進(jìn)行的是較為前沿且高通用的算法研究,研究成果通常會通過API接口或SDK形式對其他BG輸出,而業(yè)務(wù)性強的具體場景一般都需要算法的定制化,按需制作。相比以主導(dǎo)者的身份統(tǒng)籌業(yè)務(wù)BG,更多的可能是以中臺的定位幫助業(yè)務(wù)BG打造搭載前沿技術(shù)的產(chǎn)品。
光子星球自一位接近騰訊人士處了解到,AI Labs一貫給其他BG的印象便是"不干實事、論文灌水",之所以會讓同僚們產(chǎn)生如此刻板印象, 是因為許多前沿研究僅有成果而未能投產(chǎn),"并非研究人員劃水"。其中比較典型的是經(jīng)過AI Labs多次優(yōu)化后的智能音箱,作為騰訊20周年慶的員工禮物于內(nèi)部送出的同時項目也面臨叫停的風(fēng)險。
據(jù)了解,智能音箱項目于2018年4月上馬,隸屬于當(dāng)時騰訊移動互聯(lián)網(wǎng)事業(yè)群(MIG)旗下的智能創(chuàng)新業(yè)務(wù)事業(yè)部,其發(fā)布首日便在京東商城取得了兩萬臺的首日銷量。只是在智能音箱項目上線后8個月,CSIG作為當(dāng)時騰訊的業(yè)務(wù)重心也推出了自己的智能音箱項目叮當(dāng)帶屏音箱,項目劃分問題與不同BG間微妙的"市場競爭"關(guān)系耐人尋味,這或許也是智能音箱項目被叫停的原因。
"當(dāng)一群本應(yīng)專研算法,頭腦風(fēng)暴公司下一階段核心競爭力的組織疲于應(yīng)付各個業(yè)務(wù)BG的產(chǎn)品,甚至下場田忌賽馬,即使如此還是不能落下學(xué)術(shù)產(chǎn)出,(公司)還能指望它做得多好?"一位接近騰訊人士說。
技術(shù)變現(xiàn)是大廠技術(shù)部門的永恒命題,關(guān)鍵在于著急與否。一位咨詢顧問告訴光子星球,相比于進(jìn)入大廠的中臺,淪為"算法外包工",無論是進(jìn)入工業(yè)界的業(yè)務(wù)部門還是轉(zhuǎn)身高校專研學(xué)術(shù),都是性價比更高的選擇。這或許也解釋了曾經(jīng)騰訊AI Labs主任、斯坦福博士張潼于2018年12月離職并重返學(xué)術(shù)界的原因。
如果未曾出現(xiàn)大模型這樣目前公認(rèn)的通往AGI的切實路徑,AI Labs可能也不會走上風(fēng)口浪尖。只是中臺的角色定位不變的話,沒有強有力的話語權(quán)支撐,AI Labs能否完成組織交付的任務(wù)還是要打一個問號。
畢竟曾經(jīng)展開中臺這個故事的阿里已經(jīng)通過分拆上市解構(gòu)了中臺神話,就像亟需數(shù)字化的中小企業(yè)中業(yè)務(wù)部門與IT部門相互不對付,中臺與各事業(yè)群之間的微妙關(guān)系已然讓互聯(lián)網(wǎng)企業(yè)組織架構(gòu)走進(jìn)了一個死胡同。
成也賽馬,敗也賽馬?
人都是經(jīng)驗的奴隸,如果說AI Labs為中臺乃是騰訊發(fā)展至今的慣性使然,顯然這樣的慣性并不止一種。其中比較典型的是騰訊長期坐鎮(zhèn)南山巍然不動,"把半條命交給合作伙伴"的投資擴張邏輯,以及眾所周知的內(nèi)部賽馬。
在MaaS(model as a service)愈發(fā)為人所重視的當(dāng)下,大模型如果可以被視作一個產(chǎn)品的話,極大可能是通往新世界的船票。因此在大模型賽道,騰訊想必不會將哥倫布的角色拱手讓人,尤其是模型層,只是在應(yīng)用層可能會依靠合作伙伴建立生態(tài)圈,遠(yuǎn)有微信上的豐富應(yīng)用,近也有QQ上開始內(nèi)測的midjourney。
至于騰訊為何選擇QQ生態(tài)而非微信生態(tài),可想而知的原因可能是QQ用戶群體相對年輕化,而且在PC端的產(chǎn)品呈現(xiàn)上顯然是QQ更勝一籌。此外,這一選擇也存在強烈的"試水"性質(zhì),畢竟midjourney本身還未曾以成熟的產(chǎn)品形式呈現(xiàn),在QQ之前,僅以API形式接入了discord。
更值得一提的是大模型賽道的賽馬,曾經(jīng)賽馬跑出的神話實際上早已在算法時代為頭條系的崛起而破滅,因為賽馬機制本質(zhì)上是建立在冗余前提下,通過資源優(yōu)勢以面找點,重復(fù)造輪子,有點類似于數(shù)學(xué)中的窮舉法。之所以神話破滅,是在于賽馬在保險的同時也讓騰訊喪失了曾經(jīng)的敏捷,最典型的便是短視頻應(yīng)用至今只跑出來了視頻號這個全村的希望。
不過,大模型賽道的賽馬說不定還真能行。
因為大模型訓(xùn)練非一夕之功,更不是某個強烈需求敏捷能力的垂類。重資產(chǎn)投入、試錯成本高昂的預(yù)期以及應(yīng)用層呈現(xiàn)的千奇百怪很大程度上彌平了賽馬機制的缺陷,一方面是應(yīng)用多樣化避免了重復(fù)造輪子造成的資源浪費,另一方面是大模型特有的知識蒸餾讓試錯不再可怕,即使OpenAI珠玉在前,大家對國內(nèi)的各家大模型仍抱有寬容的態(tài)度,無論是公眾層面還是公司內(nèi)部。
所幸新一輪的賽馬或許不需要決出個勝負(fù),更重要的是勝負(fù)之外的結(jié)果。騰訊也應(yīng)該感謝OpenAI開啟的新時代,一個不再追求短平快,連方向路徑都已昭然若揭的時代,讓缺乏敏捷、缺乏對核心抓手的嗅覺的騰訊重回棋盤之上,與競對一起自天元落子。
只是大模型也并非萬能,最起碼,騰訊組織架構(gòu)的頑疾以及整體戰(zhàn)略上的模糊尚待調(diào)整。
如果希望AI Labs是騰訊這艘船的哥倫布,那么拆除組織架構(gòu)內(nèi)的部門墻以及重塑對創(chuàng)新的態(tài)度將是重中之重。例如光子星球自一位接近騰訊人士處了解到,AI Labs曾出走多位頂尖人才,他們曾經(jīng)在騰訊內(nèi)部的創(chuàng)新成果也在出走后落地多個垂直領(lǐng)域,甚至其中不乏龍頭的存在。
如果希望AI Labs這位哥倫布能真的發(fā)現(xiàn)新大陸,起碼需要堅定地朝著正確方向前進(jìn)。這一點恰是騰訊在開啟賽馬之路后丟失的能力,因為賽馬的本質(zhì)在于有力卻不知何處使?,F(xiàn)在的騰訊能否在賽馬機制的路徑依賴下突破以面找點,以各個BG在應(yīng)用層積累的數(shù)據(jù)庫為基礎(chǔ),在高效協(xié)同之下跑出一個大模型來,我們還在等待這份答卷。
只是留給騰訊的時間可能不多了,隨著夏季到來,今年又恰是厄爾尼諾之年,用電問題將愈發(fā)嚴(yán)峻,屆時大模型訓(xùn)練想必會受到不小的影響。
一步慢可能步步慢,賽馬機制在短視頻上的失敗讓曾經(jīng)的"后發(fā)先至"從神話變成遮羞布,大模型將是騰訊能否正視自身問題,向世界證明自己仍具備打硬仗能力的最好機會。畢竟,就算是在騰訊如今最重視的市值管理上,大股東們還在減持。