在百度發(fā)布“文心一言”、阿里發(fā)布“通義千問(wèn)”大模型后,騰訊什么時(shí)候發(fā)布通用型大模型?”成為業(yè)界關(guān)心的話題。
對(duì)于這些問(wèn)題,騰訊2023年股東大會(huì)上,騰訊董事會(huì)馬化騰回應(yīng)稱“騰訊正在專注于研發(fā)工作,并不急于展示尚未成熟的產(chǎn)品。現(xiàn)在很多公司都太過(guò)急切,似乎是為了提振股價(jià),我們一直以來(lái)都不是那樣的風(fēng)格。”
騰訊的通用型大模型遲遲沒(méi)有露面,騰訊CSIG(云與智慧產(chǎn)業(yè)事業(yè)群)披露了針對(duì)行業(yè)大模型的進(jìn)展,回應(yīng)行業(yè)客戶的部分疑問(wèn)與焦慮。
行業(yè)大模型先行
騰訊正在依托騰訊云TI平臺(tái)打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù)。具體而言,是基于騰訊云此前發(fā)布的高性能計(jì)算機(jī)群HCC、自研星脈計(jì)算網(wǎng)絡(luò)架構(gòu)、向量數(shù)據(jù)庫(kù)這些技術(shù)底座,以及包含了數(shù)據(jù)標(biāo)注、數(shù)據(jù)訓(xùn)練、加速組件等在內(nèi)的TI平臺(tái),搭建面向垂類行業(yè)的大模型平臺(tái)。垂類行業(yè)企業(yè)在其中進(jìn)行挑選,再針對(duì)性進(jìn)行數(shù)據(jù)精調(diào),將其升級(jí)為企業(yè)專屬大模型。
事實(shí)上,自從ChatGPT掀起大模型的熱潮,如何將大模型能力應(yīng)用到自身的行業(yè)和場(chǎng)景里,以及如何解決成本、數(shù)據(jù)、安全等大模型實(shí)際落地難題,成為行業(yè)關(guān)注的焦點(diǎn)。
在騰訊方面看來(lái),依據(jù)企業(yè)實(shí)際需求,進(jìn)而定制一個(gè)專屬大模型,或許是解決這些問(wèn)題的答案。更進(jìn)一步來(lái)看,產(chǎn)業(yè)大模型需要整個(gè)行業(yè)共建投入,CSIG CEO湯道生表示,生態(tài)共建是AI發(fā)展的有效路徑。
據(jù)記者了解,騰訊云行業(yè)大模型平臺(tái)合作伙伴分為兩類:共創(chuàng)型與生態(tài)型。在騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲看來(lái),騰訊產(chǎn)業(yè)大模型目前尚處于初級(jí)階段,很多方面需要與合作伙伴共創(chuàng),以便騰訊更深入地了解具體行業(yè)內(nèi)的know-how以及具體場(chǎng)景需求等。
例如,過(guò)去的平臺(tái)更突出工具屬性,客戶可以在平臺(tái)上做數(shù)據(jù)標(biāo)注與訓(xùn)練、做模型評(píng)測(cè)等,而如今平臺(tái)升級(jí)為MaaS,在工具屬性之外內(nèi)置行業(yè)大模型,可以直接完成下游任務(wù),如智能客服、OCR(文字識(shí)別)等。
至于騰訊云行業(yè)大模型的具體參數(shù)量問(wèn)題,吳運(yùn)聲表示,高參數(shù)量背后是高成本,騰訊核心訴求在于通過(guò)最有效、最低成本的手段去解決客戶問(wèn)題。
在國(guó)內(nèi)“百模大戰(zhàn)”的當(dāng)下,諸多企業(yè)均可以通過(guò)開(kāi)源平臺(tái)開(kāi)發(fā)屬于自己的大模型平臺(tái),國(guó)內(nèi)人工智能在大模型帶動(dòng)下,進(jìn)入一輪底層算法革新的洗牌。但這在騰訊云副總裁吳永堅(jiān)看來(lái),并非徹底的“重頭開(kāi)始”。他對(duì)第一財(cái)經(jīng)記者表示,騰訊在人工智能領(lǐng)域的技術(shù)過(guò)去十年一直在發(fā)展,此次大模型帶動(dòng)的技術(shù)迭代并沒(méi)有本質(zhì)變化,反而讓具備能力的企業(yè)在基礎(chǔ)建設(shè)方面的優(yōu)勢(shì)延續(xù)下去。
如MaaS平臺(tái)中的TI平臺(tái)是騰訊過(guò)去幾年一直在推的產(chǎn)品,此次是結(jié)合騰訊具體行業(yè)解決方案進(jìn)行呈現(xiàn),因此不能簡(jiǎn)單地說(shuō)重新洗牌。以及,如果長(zhǎng)期積累的人工標(biāo)注、深度學(xué)習(xí)能力,哪怕新的大模型技術(shù)出現(xiàn),企業(yè)也抓不住。
但從現(xiàn)場(chǎng)具體演示案例與站臺(tái)合作企業(yè)來(lái)看,此次騰訊產(chǎn)業(yè)大模型主要以已有產(chǎn)品與老客戶群體升級(jí)為主,新客戶群有一些但不多,更大的拓展仍需靜待技術(shù)與產(chǎn)品層面發(fā)生質(zhì)變。
“多條腿”布局大模型賽局
就整個(gè)行業(yè)而言,OpenAI旗下的ChatGPT是最為典型的通用型大模型,目前在參數(shù)量、算力、算法、工程化能力等方面領(lǐng)先,此次騰訊選擇優(yōu)先推出行業(yè)大模型,在吳運(yùn)聲看來(lái),主要是在合適的時(shí)間點(diǎn),將過(guò)去的實(shí)踐與技術(shù)沉淀,以及積累的工具鏈分享出來(lái),將產(chǎn)業(yè)大模型與更多行業(yè)進(jìn)行深入結(jié)合。
一位行業(yè)人士對(duì)記者表示,騰訊云行業(yè)大模型發(fā)布背后一個(gè)原因在于,騰訊云亟需大模型技術(shù)的加持,進(jìn)行老客戶群的維護(hù),以及新客戶的拓展,畢竟目前華為云、百度云、阿里云紛紛依憑各自的大模型技術(shù)大力拉客戶。雖說(shuō)戰(zhàn)略層面可以謹(jǐn)慎,但戰(zhàn)術(shù)層面如果動(dòng)作稍慢,那么騰訊云在市場(chǎng)拓展層面將更加被動(dòng)。
去年財(cái)報(bào)會(huì)上,騰訊方面表示,希望提高云業(yè)務(wù)的收入邊際,減少虧損的項(xiàng)目,進(jìn)一步追求“高質(zhì)量”的增長(zhǎng)。體現(xiàn)到數(shù)據(jù)上,IDC報(bào)告顯示,從公有云IaaS + PaaS 市場(chǎng)份額來(lái)看,2022年下半年,仍位列第一的阿里云市場(chǎng)占有率從36.7%減少4.8%至 31.9%;華為云由10.8%增加1.3%至 12.1%,排名由第三位升至第二位;天翼云由8.9%增加1.4%至10.3%,由第四位升至第三位;騰訊云市場(chǎng)份額由11.1%減少1.2%至9.9%,排名從第二名滑落至第四名。在云計(jì)算市場(chǎng)競(jìng)爭(zhēng)越發(fā)白熱化的背景下,騰訊選擇在行業(yè)大模型方面加速、在通用型大模型方面謹(jǐn)慎。
此前在財(cái)報(bào)電話會(huì)中,騰訊方面表示正大力投入建設(shè)人工智能的能力和云基礎(chǔ)設(shè)施,以擁抱基礎(chǔ)模型帶來(lái)的機(jī)會(huì)。騰訊總裁劉熾平表示,“就我們的AI基礎(chǔ)模型混元大模型來(lái)說(shuō),目前正在取得良好進(jìn)展,模型構(gòu)建進(jìn)展順利”。
劉熾平表示,騰訊的數(shù)據(jù)包括國(guó)內(nèi)一系列高質(zhì)量公共數(shù)據(jù)與騰訊內(nèi)部生態(tài)數(shù)據(jù),這足以對(duì)整體數(shù)據(jù)庫(kù)形成獨(dú)特與完備的補(bǔ)充。騰訊目前正積極對(duì)訓(xùn)練部門及生產(chǎn)線擴(kuò)容。
至于通用型混元大模型尚未完全面向公眾開(kāi)放的原因,馬化騰此前回應(yīng)稱,“我們最開(kāi)始以為這是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì),但是越想越覺(jué)得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇。AI非常重要,但這的確需要有很多的積累”,“對(duì)于工業(yè)革命來(lái)講,早一個(gè)月把電燈泡拿出來(lái),在長(zhǎng)的時(shí)間跨度上來(lái)看是不那么重要的。關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好”。
除了通用型與產(chǎn)業(yè)型,騰訊在大模型領(lǐng)域也在積極通過(guò)投資布局。此前有消息稱中國(guó)大模型領(lǐng)域初創(chuàng)公司MiniMax將完成超過(guò)2.5億美元的融資,估值約12億美元,騰訊將參與投資,MiniMax與騰訊方面均未對(duì)該數(shù)字進(jìn)行回應(yīng)。
今年5月31日,北京深言科技有限責(zé)任公司發(fā)生工商變更,股東新增騰訊旗下廣西騰訊創(chuàng)業(yè)投資有限公司等,公司注冊(cè)資本由約131.6萬(wàn)增至約183.5萬(wàn)元。此前,深言科技投資方包括奇績(jī)創(chuàng)壇、英諾天使基金、紅杉中國(guó)等。北京深言科技有限責(zé)任公司(深言科技,DeepLang AI)成立于2022年3月,孵化自清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室(THUNLP)和北京智源人工智能研究院(BAAI),旨在打造基于大規(guī)模預(yù)訓(xùn)練模型的新一代智能文本信息處理引擎。
另在6月6日,有消息稱,光年之外近期完成了2.3億美元新一輪融資,投前估值10億美元。本輪融資由源碼資本作為領(lǐng)投方,出資8000萬(wàn)美元;騰訊出資5000萬(wàn)美元;五源資本與快手創(chuàng)始人宿華均出資4000萬(wàn)美元。對(duì)該消息,王慧文對(duì)記者回應(yīng)稱“具體數(shù)額不準(zhǔn)確”。
目前行業(yè)尚處于密集發(fā)布“大模型”的營(yíng)銷階段,具體落地與商業(yè)化層面并無(wú)一家實(shí)現(xiàn)質(zhì)的突破,騰訊延續(xù)生態(tài)型的合作模式,同時(shí)多路徑探索,或許是一種更適合自身的可攻可守方式。