深燃(shenrancaijing)原創(chuàng)
作者 | 金玙璠 賀樹(shù)龍
編輯 | 賀樹(shù)龍
ChatGPT上線半年后,一場(chǎng)大模型追逐戰(zhàn)繼續(xù)在太平洋兩岸上演。
由OpenAI、微軟和英偉達(dá)組成的聯(lián)盟,正在太平洋東岸玩命狂奔。今年3月以來(lái),中國(guó)科技公司緊急跟進(jìn),百度、阿里、商湯、科大訊飛相繼推出“類ChatGPT”產(chǎn)品,騰訊、華為、京東公開(kāi)表示正在跟進(jìn)大模型,都想抓住這個(gè)比互聯(lián)網(wǎng)時(shí)代還“大十倍”的機(jī)會(huì)。
“百模大戰(zhàn)”當(dāng)前,作為國(guó)內(nèi)大型科技企業(yè)的小米,卻顯得格外冷靜。
小米掌門人雷軍說(shuō),小米正在研發(fā)一些技術(shù)和產(chǎn)品,等打磨好了再給大家演示。小米集團(tuán)總裁盧偉冰稱,小米目前擁有超過(guò)1200人的AI團(tuán)隊(duì),會(huì)積極擁抱大模型,與業(yè)務(wù)深度結(jié)合,但不會(huì)像OpenAI一樣去做通用大模型。
這些信息都加深了外界的疑問(wèn):小米會(huì)加入“百模大戰(zhàn)”嗎?
小米集團(tuán)AI實(shí)驗(yàn)室主任王斌博士告訴深燃,小米自己會(huì)去自研通用大模型,但不會(huì)單獨(dú)發(fā)布一款類ChatGPT產(chǎn)品,“也不會(huì)發(fā)布一個(gè)PPT,或者演示幾個(gè)例子,就說(shuō)我們有大模型了”,而是自研大模型最終會(huì)由產(chǎn)品帶出來(lái)。
這是繼小米官宣大模型團(tuán)隊(duì)后,首度對(duì)外披露大模型的路線和進(jìn)展。今年4月14日,小米宣布大模型團(tuán)隊(duì)由欒劍帶隊(duì),向王斌匯報(bào)。王斌曾在中科院從事了20多年NLP(自然語(yǔ)言處理)相關(guān)的研究和開(kāi)發(fā)工作,2018年加入小米,2019年起負(fù)責(zé)AI實(shí)驗(yàn)室。AI實(shí)驗(yàn)室是小米AI戰(zhàn)略的核心部門。
曾經(jīng)做過(guò)對(duì)話大模型的小米,在通用預(yù)訓(xùn)練語(yǔ)言大模型上,是少有的理智派。王斌透露,目前專職大模型團(tuán)隊(duì)30多人,不會(huì)馬上極速擴(kuò)張;這個(gè)團(tuán)隊(duì)的目標(biāo)還是通用語(yǔ)言大模型,第一步的目標(biāo)基座模型參數(shù)在幾百億,然后會(huì)視前期爬坡結(jié)果,再?zèng)Q定下一步投入。
“從研發(fā)出大模型到落地還有很長(zhǎng)的一段距離,是否能找到合適的重要場(chǎng)景是很多大模型公司的痛點(diǎn)?!痹谕醣罂磥?lái),小米的優(yōu)勢(shì)是有足夠多的現(xiàn)成的大模型落地場(chǎng)景,包括小愛(ài)同學(xué)、loT、自動(dòng)駕駛、機(jī)器人等等,豐富的應(yīng)用場(chǎng)景也能夠反哺大模型的能力。
小米不缺場(chǎng)景,但要訓(xùn)練出大模型,數(shù)據(jù)、算力、人才的積累缺一不可。王斌說(shuō),小米在人才上有一定儲(chǔ)備,算力和數(shù)據(jù)量方面的挑戰(zhàn)較大。一方面,算力需要克服系統(tǒng)級(jí)的挑戰(zhàn),且要做到訓(xùn)練成本可控;另一方面,高質(zhì)量數(shù)據(jù)的獲得、清洗,都要花費(fèi)不少時(shí)間和成本。
在新一輪AI大模型浪潮中,小米AI團(tuán)隊(duì)為什么不發(fā)布“類ChatGPT產(chǎn)品”?小米是怎么判斷大模型的技術(shù)路線、技術(shù)難度的?日前,深燃總編輯賀樹(shù)龍和小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室主任王斌進(jìn)行了一場(chǎng)對(duì)話。以下是核心內(nèi)容:
深燃:4月14日,小米任命欒劍為大模型團(tuán)隊(duì)負(fù)責(zé)人,向你匯報(bào)。能否介紹下小米大模型團(tuán)隊(duì)是怎么誕生的?
王斌:大模型團(tuán)隊(duì)是4月份宣布的,但在這之前已經(jīng)開(kāi)始運(yùn)作。
去年11月30日,OpenAI發(fā)布ChatGPT后,我們一堆人快速注冊(cè)賬號(hào),在上面開(kāi)始玩。ChatGPT確實(shí)很顛覆,我們做了這么多年AI,它的很多能力超出了我們研發(fā)人員的預(yù)期。
很快,我們就組織了多個(gè)內(nèi)部大模型交流群,討論大模型的技術(shù),以及它對(duì)機(jī)器翻譯、人機(jī)對(duì)話、智能問(wèn)答、客服會(huì)產(chǎn)生哪些顛覆性的影響。早期參加研討的很多人,后來(lái)都成了專職大模型團(tuán)隊(duì)的重要成員。
深燃:小米大模型團(tuán)隊(duì)會(huì)不會(huì)來(lái)得有點(diǎn)晚?
王斌:對(duì)于大模型,我們屬于理智派。
在ChatGPT誕生之前,小米內(nèi)部做過(guò)大模型相關(guān)的研發(fā)和應(yīng)用,主要是預(yù)訓(xùn)練+下游任務(wù)監(jiān)督微調(diào)的方式來(lái)做人機(jī)對(duì)話,模型的參數(shù)在幾十億級(jí)別。當(dāng)然,這類模型并非現(xiàn)在所說(shuō)的通用大模型。
我們非常清楚,通用大模型的研發(fā)和應(yīng)用是一個(gè)長(zhǎng)期的工作,不是早晚的問(wèn)題。我們是按照自己的時(shí)間規(guī)劃和步驟在走,當(dāng)時(shí)覺(jué)得時(shí)間點(diǎn)到了,就做了團(tuán)隊(duì)發(fā)布。
深燃:大模型團(tuán)隊(duì)有多少人?有繼續(xù)擴(kuò)張的計(jì)劃嗎?
王斌:主力團(tuán)隊(duì)目前有30多人。我們目前是先按照人才、數(shù)據(jù)、模型、算力、評(píng)測(cè)、產(chǎn)品這幾個(gè)方面去籌備,等到了一定階段再逐步調(diào)整或擴(kuò)張。
我們目前不會(huì)馬上擴(kuò)大人數(shù),比如一下招到100人。因?yàn)樵诜e累能力爬坡階段,可能招這么多人都不知道怎么安排,反而是一種浪費(fèi)。
隨著大模型相關(guān)信息的不斷公開(kāi),資本和人才的不斷涌入,大模型領(lǐng)域的發(fā)展非??欤蠹业目捶ㄗ兓埠艽?。前不久ChatGPT剛出來(lái)時(shí),大家覺(jué)得,實(shí)現(xiàn)類似的大模型基本不可能,但是慢慢地,很多人覺(jué)得可能性很大,還有一些人認(rèn)為,不需要那么大規(guī)模的模型就可以滿足很多產(chǎn)品的需求。大家的投資力度,差異也特別大。有些人可能覺(jué)得團(tuán)隊(duì)至少要幾百人,有些人認(rèn)為不需要。
來(lái)源 / 視覺(jué)中國(guó)
深燃:接下來(lái)有沒(méi)有一些階段性的規(guī)劃,什么時(shí)候?qū)?nèi)測(cè)試和對(duì)外發(fā)布?
王斌:跟其他公司不太一樣,小米天生帶著產(chǎn)品的屬性,我相信小米大模型出來(lái)的時(shí)候,是由產(chǎn)品帶著出來(lái)。
我們內(nèi)部有可能會(huì)在Q3之前測(cè)試。不過(guò),這也不是一個(gè)必然的節(jié)點(diǎn)。
深燃:也就是說(shuō),小米不會(huì)發(fā)布一個(gè)類ChatGPT產(chǎn)品?
王斌:對(duì),我們不會(huì)發(fā)布一個(gè)PPT,或者演示一下我們有大模型了。應(yīng)用場(chǎng)景豐富是我們最大的優(yōu)勢(shì)。小米大模型會(huì)跟場(chǎng)景結(jié)合得更緊密,肯定是圍繞產(chǎn)品的節(jié)奏去做相應(yīng)的發(fā)布規(guī)劃。
深燃:除了人力之外,小米做大模型在算力方面的成本大概是多少?
王斌:我們屬于中等規(guī)模的投入,會(huì)視前期爬坡的結(jié)果,再?zèng)Q定下一步投入。
我們的基本判斷是,適用于小米產(chǎn)品和業(yè)務(wù)的模型,參數(shù)可能在幾百億,會(huì)比千億規(guī)模低,用于訓(xùn)練的機(jī)器的投入大概是幾千萬(wàn)人民幣級(jí)別。
深燃:之前小米做的幾十億參數(shù)級(jí)別的模型,現(xiàn)在怎么樣了?
王斌:去年發(fā)布的ChatGPT是大模型的一種,叫通用預(yù)訓(xùn)練語(yǔ)言大模型。但大模型本身很早就出現(xiàn)了,大家有不同的路線、做法。
我們較早就開(kāi)始跟進(jìn)大模型,當(dāng)時(shí)做的是一個(gè)對(duì)話專用模型,大概是28億到30億的參數(shù)。它是在預(yù)訓(xùn)練基座模型的基礎(chǔ)上,通過(guò)對(duì)話數(shù)據(jù)的微調(diào)來(lái)實(shí)現(xiàn)的,并不是現(xiàn)在的通用大模型,而是專用于人機(jī)對(duì)話,比如,可以提高小愛(ài)同學(xué)對(duì)話的流暢度、多樣性,讓它可以聊下去。后來(lái)這個(gè)模型上線到小愛(ài),進(jìn)行了小規(guī)模上線測(cè)試。
所以,小愛(ài)同學(xué)里已經(jīng)用到了AIGC,只不過(guò),我們?cè)诋a(chǎn)品層面,沒(méi)有全部使用這個(gè)大模型,而是利用傳統(tǒng)模型和對(duì)話大模型的互補(bǔ)性,將兩個(gè)混合使用。
小米的通用大模型在落地產(chǎn)品時(shí),很可能也是這種混合模式。傳統(tǒng)模型處理得非常好的問(wèn)題,就交給傳統(tǒng)模型。大模型就解決它擅長(zhǎng)的問(wèn)題,例如一些小概率事件或是長(zhǎng)尾對(duì)話。
現(xiàn)在出來(lái)的通用大模型,在對(duì)話水平上,明顯高于之前的對(duì)話專用大模型,所以這部分團(tuán)隊(duì)也全都轉(zhuǎn)到通用大模型上了。這個(gè)團(tuán)隊(duì)跑通過(guò)整個(gè)對(duì)話大模型的訓(xùn)練過(guò)程,爬過(guò)一些坑,加上數(shù)據(jù)的積累,有一定優(yōu)勢(shì)。
深燃:這段時(shí)間以來(lái)的技術(shù)進(jìn)展非常迅猛,國(guó)內(nèi)大模型在密集發(fā)布,會(huì)因?yàn)檫M(jìn)展慢而焦慮嗎?
王斌:我曾經(jīng)有一段時(shí)間比較焦慮,因?yàn)槔喜幌聢?chǎng)做就會(huì)有點(diǎn)慌,你就會(huì)想,“別人怎么進(jìn)展這么快,一下子就做出來(lái)了?”現(xiàn)在我們下場(chǎng)去做了,也就不焦慮了。
據(jù)說(shuō),中國(guó)現(xiàn)在是“百模大戰(zhàn)”,已經(jīng)發(fā)布了80多個(gè)大模型,有些提供了內(nèi)測(cè),有些只是PPT發(fā)布。有些模型的效果還是不錯(cuò)的,光從發(fā)布的水平看,我們現(xiàn)有的自研大模型的水平,看上去也不比很多模型差。但我們不急于做對(duì)外發(fā)布。第一,對(duì)于小米這樣的公司來(lái)說(shuō),沒(méi)有太大意義。第二,我們還是希望圍繞產(chǎn)品,把自研模型做得更好一些,再一同發(fā)布。
深燃:你認(rèn)為國(guó)內(nèi)公司的大模型有機(jī)會(huì)趕上OpenAI嗎?差距有多大?他們喜歡用三個(gè)月、六個(gè)月來(lái)形容。
王斌:目前來(lái)看,OpenAI肯定是走得非??壳暗?,它投入時(shí)間早,在人才、數(shù)據(jù)、算力、工程、產(chǎn)品等方面都有非常強(qiáng)的積累。從國(guó)內(nèi)的情況看,我感覺(jué)目前和OpenAI還是有一定差距,有人說(shuō)是三個(gè)月、六個(gè)月,也有人說(shuō)是一年、兩年。時(shí)間上,真不好說(shuō)。
因?yàn)樵趺丛u(píng)價(jià)大模型,本身就是個(gè)挺難的問(wèn)題?,F(xiàn)在出現(xiàn)了各種大模型的排行榜,但目前都沒(méi)有得到大家的一致認(rèn)可。沒(méi)有真正的評(píng)價(jià)標(biāo)準(zhǔn),那么談三個(gè)月、六個(gè)月趕上,也就是個(gè)拍腦袋的說(shuō)法。
至于國(guó)內(nèi)有沒(méi)有可能追上OpenAI,我早期比較悲觀,覺(jué)得幾乎不可能,但隨著各種開(kāi)源方案、各種團(tuán)隊(duì)和資本的涌入,我的判斷更樂(lè)觀一些。我認(rèn)為,國(guó)內(nèi)有機(jī)會(huì)跟OpenAI縮小距離,去接近甚至在很多場(chǎng)景超過(guò)它。
大模型看上去不像芯片有那么高的門檻,通過(guò)人才、數(shù)據(jù)、算力等的不斷積累和優(yōu)化,是有可能不斷縮小差距的。
深燃:國(guó)內(nèi)哪些類型的公司搞大模型更有優(yōu)勢(shì)?小米的機(jī)會(huì)在哪里?
王斌:不管大公司還是中小的創(chuàng)業(yè)公司,都有各自的生存空間。大模型是一個(gè)生態(tài),并非一家獨(dú)大就能通吃,生態(tài)上的所有公司,包括做算力的、做數(shù)據(jù)的、做應(yīng)用的,還有真正做大模型的公司,都有各自的機(jī)會(huì)。
像小米做大模型,有應(yīng)用場(chǎng)景的優(yōu)勢(shì)。我們認(rèn)為,大模型跟場(chǎng)景的結(jié)合會(huì)是一個(gè)巨大的機(jī)會(huì)。
因?yàn)槿绻皇前l(fā)布大模型,沒(méi)人用,那不一定能通過(guò)滾動(dòng)快速發(fā)展起來(lái)。而我們可以馬上落地到場(chǎng)景,通過(guò)不斷迭代,在這些場(chǎng)景充分發(fā)揮出大模型的威力。
雖然我們目前只整合了一支30多人的主力團(tuán)隊(duì),但實(shí)際上外圍還有非常多的人。整個(gè)AI實(shí)驗(yàn)室,有NLP背景且在做具體應(yīng)用的,就有一百多人,包括知識(shí)圖譜、機(jī)器翻譯、人機(jī)對(duì)話、智能客服、智能問(wèn)答。他們都是具有大模型基礎(chǔ)思維以及相關(guān)技術(shù)的人員,正在從各自應(yīng)用的角度推動(dòng)對(duì)大模型的探索。
王斌
深燃:小米在NLP研究上的積累,對(duì)大模型的價(jià)值有多大?
王斌:這在業(yè)界存在兩種說(shuō)法。一種說(shuō)法是,我們這些人可能沒(méi)活干了,AI革了自己的命,特別是做NLP的人可能就沒(méi)飯碗了。還有一種說(shuō)法是,畢竟大模型是從NLP干出來(lái)的,做NLP的人有先天優(yōu)勢(shì)。
這兩種說(shuō)法都有一定道理,但畢竟涉及到我的飯碗,我更傾向于后一種說(shuō)法。
大模型原本在各個(gè)領(lǐng)域都有探索,包括視覺(jué)、語(yǔ)音、NLP。但為什么是在NLP這個(gè)領(lǐng)域首先突破,我相信這里面有本質(zhì)的原因。我理解至少有兩點(diǎn):第一是語(yǔ)言數(shù)據(jù)的豐富性和易獲得性,第二,語(yǔ)言數(shù)據(jù)背后隱含著非常豐富的反應(yīng)人類思考過(guò)程的知識(shí)。
所以我相信,在NLP領(lǐng)域有多年積累的人,對(duì)大模型的理解和改造能力有一定的先天優(yōu)勢(shì)。小米大模型團(tuán)隊(duì)的成員,很多原來(lái)是做NLP方向的。國(guó)內(nèi)做大模型非常不錯(cuò)的幾家創(chuàng)業(yè)公司,也是從NLP領(lǐng)域出來(lái)的。
深燃:小米攻克大模型目前的難點(diǎn)有哪些?怎么克服?
王斌:首先我還是想說(shuō),大模型本身有非常巨大的挑戰(zhàn)。
一項(xiàng)巨大的挑戰(zhàn)是技術(shù)的不確定性。我們看過(guò)一些報(bào)道,甚至OpenAI團(tuán)隊(duì)自己也不十分清楚大模型背后的真正原理,如果再做一次,對(duì)是否能夠出現(xiàn)同樣的“涌現(xiàn)”結(jié)果也沒(méi)有把握。我相信這一點(diǎn)上OpenAI講的是實(shí)話,由于技術(shù)上有非常大的不確定性,所以有投入不能保證一定能訓(xùn)練出滿足預(yù)期的大模型。
高質(zhì)量數(shù)據(jù)的積累也是一項(xiàng)挑戰(zhàn)。大家一般認(rèn)為,大模型需要極大規(guī)模高質(zhì)量的訓(xùn)練數(shù)據(jù)。網(wǎng)絡(luò)上公開(kāi)得到的數(shù)據(jù),質(zhì)量總體比較差,所以數(shù)據(jù)的獲取、清洗,都是比較大的挑戰(zhàn)。
另外的挑戰(zhàn)當(dāng)然是算力。首先,并不是說(shuō)有這么多卡就能夠訓(xùn)出來(lái),怎么能夠用好這些卡本身就是一個(gè)系統(tǒng)級(jí)的挑戰(zhàn)。其次,因?yàn)樵谟?xùn)練過(guò)程中可能會(huì)犯錯(cuò),可能錢燒沒(méi)了,什么都燒不出來(lái),所以要看你有沒(méi)有能力用可控的成本把大模型訓(xùn)練出來(lái)。
實(shí)事求是地說(shuō),目前數(shù)據(jù)和算力的挑戰(zhàn)還是比較大的,尤其是大規(guī)模的高質(zhì)量數(shù)據(jù)。經(jīng)過(guò)前面一段時(shí)間的爬坡,我們現(xiàn)在基本有把握,只要數(shù)據(jù)到位,利用現(xiàn)有的算力,我們大概能知道多少天能夠訓(xùn)出一個(gè)還可以的基座模型。
深燃:現(xiàn)在大模型訓(xùn)練的成本降低了嗎?
王斌:一方面,試錯(cuò)的成本比以前低了。因?yàn)榇竽P陀?xùn)練是可能走彎路、會(huì)失敗的,但是隨著各種信息的公開(kāi),現(xiàn)在可能能很快找到訓(xùn)練的正確方向。另一方面,很多云計(jì)算、芯片等公司,還有很多創(chuàng)業(yè)公司,都在提供更低成本的大模型訓(xùn)練和推理服務(wù)。隨著整個(gè)生態(tài)進(jìn)一步發(fā)展,我相信訓(xùn)練的成本會(huì)不斷降低。
深燃:能否詳細(xì)介紹下你負(fù)責(zé)的小米AI實(shí)驗(yàn)室?
王斌:在2016年“阿爾法狗(AlphaGo)”橫空出世后,雷總第一時(shí)間推動(dòng)了AI團(tuán)隊(duì)的建設(shè)。AI實(shí)驗(yàn)室于2016年正式成立,我從2019年開(kāi)始負(fù)責(zé)。
原來(lái)AI實(shí)驗(yàn)室隸屬于人工智能部。后來(lái)人工智能部合并到集團(tuán)技術(shù)委員會(huì),現(xiàn)在AI實(shí)驗(yàn)室是技術(shù)委員會(huì)的直屬部門。
AI實(shí)驗(yàn)室現(xiàn)在的團(tuán)隊(duì)規(guī)模在350人左右,下屬六個(gè)方向,分別是機(jī)器學(xué)習(xí)、自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)、聲學(xué)、語(yǔ)音和知識(shí)圖譜。
大模型出來(lái)后,AI實(shí)驗(yàn)室設(shè)立了專職大模型團(tuán)隊(duì),我們現(xiàn)在的重點(diǎn)是語(yǔ)言大模型,但也在關(guān)注跨模態(tài)大模型。
深燃:盧總(小米集團(tuán)總裁盧偉冰)說(shuō)小米AI團(tuán)隊(duì)目前超過(guò)1200人。除了AI實(shí)驗(yàn)室,小米內(nèi)部還有哪些部門跟AI強(qiáng)關(guān)聯(lián)?
王斌:AI實(shí)驗(yàn)室之外,還有小愛(ài)同學(xué)團(tuán)隊(duì),這兩個(gè)團(tuán)隊(duì)都在技術(shù)委員會(huì)下面。
技術(shù)委員會(huì)之外,還有很多部門都有比較大的AI團(tuán)隊(duì),包括汽車部的自動(dòng)駕駛部,手機(jī)的相機(jī)部、軟件部,此外,在互聯(lián)網(wǎng)業(yè)務(wù)部做的用戶增長(zhǎng)、廣告推薦,都跟AI相關(guān)。
總之,AI相關(guān)的團(tuán)隊(duì)有些在業(yè)務(wù)部門,有些在技術(shù)委員會(huì),總數(shù)大概1200人,如果再考慮一些小團(tuán)隊(duì),這個(gè)數(shù)字我個(gè)人覺(jué)得還更大一些。
深燃:小米AI實(shí)驗(yàn)室在小米AI戰(zhàn)略里是什么角色?
王斌:AI實(shí)驗(yàn)室是集團(tuán)層面的AI技術(shù)研發(fā)和輸出部門。通俗地說(shuō),我們是面向全公司輸出AI技術(shù)。
我們?cè)?jīng)把AI實(shí)驗(yàn)室比喻成集團(tuán)層面AI技術(shù)的“試驗(yàn)田”和“庫(kù)”。因?yàn)锳I發(fā)展迅速,AI實(shí)驗(yàn)室會(huì)研發(fā)一些中長(zhǎng)期的前沿技術(shù),圍繞小米業(yè)務(wù)做儲(chǔ)備,在集團(tuán)需要的時(shí)候輸出“”。
在AI技術(shù)層面,我們?cè)诠纠锟隙ㄊ莾?chǔ)備最齊全的,在行業(yè)里也是非常有實(shí)力的。
深燃:小米AI實(shí)驗(yàn)室有哪些重要的研究成果?
王斌:我們AI實(shí)驗(yàn)室的理念更強(qiáng)調(diào)技術(shù)和場(chǎng)景的結(jié)合,目前還沒(méi)有把發(fā)表論文當(dāng)作OKR。所以,我從中科院(中國(guó)科學(xué)院)來(lái)到小米后,自己感覺(jué)最大的成就不是某個(gè)單點(diǎn)的技術(shù)的進(jìn)展,而是技術(shù)和產(chǎn)品的巧妙融合。
小米是一家To C的公司,我們的AI能力輸出暫時(shí)不直接對(duì)外輸出,而是通過(guò)公司的產(chǎn)品輸出。我們的成果非常多,包括小米手機(jī)中的很多拍照和相冊(cè)處理算法,小愛(ài)同學(xué)中涉及的語(yǔ)音、NLP等算法,小米商城的推薦、搜索、客服系統(tǒng)中的AI算法。
我舉個(gè)例子,我們?cè)谑謾C(jī)上開(kāi)發(fā)了離線翻譯功能,比如出國(guó)后,很多情況下網(wǎng)絡(luò)沒(méi)有那么好,這時(shí)候打開(kāi)小米手機(jī)的翻譯功能,不用走云端,離線狀態(tài)下,實(shí)時(shí)性、隱私性和翻譯效果都比較好。這個(gè)功能的實(shí)現(xiàn)和應(yīng)用都不算容易,我們做了很多很多翻譯效果和性能的優(yōu)化工作。
在小米內(nèi)部,并不是我們自己的技術(shù),就會(huì)優(yōu)先用,內(nèi)部技術(shù)也要和外部技術(shù)去公平去PK,只有勝出才能活下來(lái),應(yīng)用到產(chǎn)品。
深燃:以ChatGPT為代表的大模型技術(shù),會(huì)對(duì)小米的哪些業(yè)務(wù)帶來(lái)影響?
王斌:大模型最強(qiáng)的能力,簡(jiǎn)單來(lái)說(shuō)就是它更理解人,它顯然能優(yōu)化人機(jī)交互的方式。小米的小愛(ài)同學(xué)、手機(jī)操作系統(tǒng)MIUI、汽車的座艙、IoT、機(jī)器人,都是應(yīng)用大模型的典型場(chǎng)景。
深燃:能不能以小愛(ài)同學(xué)舉例說(shuō)說(shuō)。
王斌:應(yīng)用到小愛(ài)同學(xué)上,能同時(shí)做到兩件事。一類是讓不可能變成可能,相當(dāng)于有了新的功能。比如,我讓小愛(ài)制定一個(gè)出行計(jì)劃或者訂餐等等。原來(lái)的技術(shù)能力沒(méi)有達(dá)到,用戶稍微換一種說(shuō)法,它就亂套了。但有了大模型的支持,它對(duì)人的話語(yǔ)的理解更深了,這樣就可以完成復(fù)雜任務(wù),這類應(yīng)用就有可行性了。
還有一類是對(duì)原來(lái)功能的增強(qiáng),相當(dāng)于錦上添花。因?yàn)槿祟惐磉_(dá)的跳躍性、多樣性,原來(lái)在小愛(ài)同學(xué)人機(jī)交互的過(guò)程中,最大的問(wèn)題就是遇到小概率事件,我們叫Corner Case,通常會(huì)采用保守策略,讓小愛(ài)說(shuō),“我回答不了”,“我還在學(xué)習(xí)”。這種托底回答也能把對(duì)話進(jìn)行下去,但體驗(yàn)不好。但大模型技術(shù)能把對(duì)話進(jìn)行得更長(zhǎng),而且大幅度提高用戶滿意度。
深燃:大模型對(duì)智能家居的影響大嗎?
王斌:按照我的個(gè)人理解,大模型至少能在交互能力上,提高智能家居的使用體驗(yàn)。
現(xiàn)在雖然有很多設(shè)備號(hào)稱“智能”,但表現(xiàn)上經(jīng)常像“智障”導(dǎo)致使用率不高。比如說(shuō),打開(kāi)空調(diào)或者調(diào)控空調(diào)溫度,如果說(shuō)法跟標(biāo)準(zhǔn)指令不一樣,就可能就無(wú)法控制IoT設(shè)備。
但大模型來(lái)了以后,對(duì)人類語(yǔ)言的理解更深了,很多情況下表達(dá)方式各種各樣,大模型能把用戶的表達(dá)翻譯成機(jī)器能聽(tīng)得懂的指令。這會(huì)帶動(dòng)更多人使用智能設(shè)備,讓整個(gè)生態(tài)能更快成長(zhǎng)起來(lái)。
深燃:除了現(xiàn)有業(yè)務(wù)的提升,還有哪些事情是以前小米做不到,但有了大模型以后有可能去做的?
王斌:我們會(huì)讓大模型和這些業(yè)務(wù)做深度的協(xié)同,當(dāng)然,除此之外,我們也在尋找更多可能性。
我們團(tuán)隊(duì)寫(xiě)了很多文章在公司內(nèi)部推廣大模型,包括大模型的概念和技術(shù)發(fā)展,教大家怎么用ChatGPT來(lái)解決業(yè)務(wù)問(wèn)題。雷總已經(jīng)要求每個(gè)部門都要學(xué)習(xí)大模型,要求大家具有基本的大模型思維,思考怎么跟業(yè)務(wù)結(jié)合。
*題圖來(lái)源于受訪者。