ChatGPT走紅后,大模型的熱度持續(xù)不減,并日漸形成了“千模大戰(zhàn)”的局面。前兩個月,百度、阿里、騰訊加入;進(jìn)入5月份,先有網(wǎng)易有道,發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產(chǎn)品;后有科大訊飛,發(fā)布認(rèn)知大模型“訊飛星火”……總之,各種大大小小的發(fā)布會,都在向外界證明自己到底有多大的想象空間。
在大模型進(jìn)展如火如荼之下,其產(chǎn)業(yè)化也被越來越多地提及,從前炒作的“AI+”也再次站上風(fēng)口。在此背景下,關(guān)于AI大模型在汽車領(lǐng)域的應(yīng)用,也開始熱度飆升。
(配圖來自Canva可畫)
智能汽車的“ChatGPT時刻”來了
目前來看,大模型重構(gòu)各行各業(yè)雖然已經(jīng)成為業(yè)界共識,但ChatGPT“上車”遠(yuǎn)比預(yù)想中的來得更快。作為繼家庭和辦公場所之外的“第三空間”,汽車正在變成一個新型智能終端。ChatGPT到來了之后,車機(jī)關(guān)系也受到了更多的影響。
一是ChatGPT對汽車自動駕駛的影響。業(yè)內(nèi)人士分析表示,大模型具備對海量數(shù)據(jù)的處理能力以及多維度分析能力,可以提供更精準(zhǔn)、更全面的數(shù)據(jù)分析和預(yù)測能力,持續(xù)優(yōu)化模型,提高智能駕駛的準(zhǔn)確性和可靠性。尤其是隨著ChatGPT的出現(xiàn),人們發(fā)現(xiàn)當(dāng)模型的參數(shù)量,達(dá)到了一定程度之后,呈現(xiàn)出的效果不是“性能變好”,而是“出奇的好”。
具體到應(yīng)用層面,大模型對自動駕駛的影響是:在云端,車企可以發(fā)揮模型參數(shù)量的大容量優(yōu)勢,通過大模型完成絕大多數(shù)的數(shù)據(jù)標(biāo)注和數(shù)據(jù)挖掘工作,節(jié)省數(shù)據(jù)標(biāo)注成本,還能夠借助仿真場景構(gòu)建賦能。在車端,它可以將分管不同子任務(wù)的小模型合并為一個大模型,節(jié)省車端推理計算時間,增加汽車安全性。最重要的是,被認(rèn)為是自動駕駛算法終局的端到端感知決策一體化算法瓶頸,或許在汽車接入大模型之后可以得到有效解決,自動駕駛算法升級指日可待。
二是對汽車智能座艙的影響。車載ChatGPT語音助手,可以處理完整的對話,比如追問,并能保持對前后文的理解,形成較為良好的語音交互體驗。比如,微軟與梅賽德斯—奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟可能性。駕駛員未來有望通過車載系統(tǒng)完成預(yù)訂餐廳、預(yù)訂電影票等任務(wù),進(jìn)一步提升便利性和生產(chǎn)力,極大地豐富智能汽車與人之間的交互體驗。
另外,在改變智能駕駛和智能座艙交互能力的情況下,其也對汽車的研發(fā)方式和商業(yè)模式產(chǎn)生全新的影響。研發(fā)方式方面,由于機(jī)器的高效標(biāo)注能力,使得需要一年時間的數(shù)據(jù)標(biāo)注任務(wù),現(xiàn)在只需要短短數(shù)小時,研發(fā)周期大幅縮短,而且多模態(tài)(視覺、語音、手勢等)的豐富數(shù)據(jù),更可以進(jìn)一步提升總體的研發(fā)效能,降低研發(fā)成本。就商業(yè)模式而言,車載AI語音交互在它具備情感智能之后,它就會從“雇傭關(guān)系”演變成“陪伴關(guān)系”,對人的喜好和習(xí)慣會更加了解,這將會衍生出全新的商業(yè)價值。
產(chǎn)業(yè)探索流派紛呈
或許正是意識到了這一點(diǎn),現(xiàn)在正有越來越多的車企選擇接入AI大模型。除了國外的奔馳宣布ChatGPT之外,國內(nèi)理想汽車也發(fā)布了自研大模型MindGPT,百度的文心一言也被接入到了長安、吉利、嵐圖、紅旗、零跑等眾多車企之中,就連“讓夢想窒息”的法拉利未來,也在新車中納入了大模型,不難預(yù)見未來大模型在智能汽車中普及,將會是大概率事件。從整個參與的車企來看,其發(fā)展大模型的方向和側(cè)重點(diǎn)并不相同。
從功能上來看其主要可以分為以下兩類:一類是用于人工智能交流對話領(lǐng)域,多數(shù)應(yīng)用在智能座艙上。比如,百度的文心一言,目前已經(jīng)有東風(fēng)日產(chǎn)、紅旗、長城等近十家車企宣布接入;上海車展期間,商湯科技亮相了日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合;此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng),已接入通義千問大模型進(jìn)行測試等。
另一類是聚焦智能駕駛的大模型應(yīng)用。比如毫末智行發(fā)布了自動駕駛生成式大模型DriveGPT,幫助解決認(rèn)知決策問題,最終實現(xiàn)端到端的自動駕駛。理想汽車自研大模型MindGPT,擺脫對高清地圖的依賴,讓汽車做到更接近人類司機(jī)的駕駛表現(xiàn)。蔚來、小鵬、長城、奇瑞四家車企,也已經(jīng)注冊申請了多個與GPT相關(guān)的商標(biāo)。
從參與主體來看,也主要可以分為兩類:一是車企親自下場做的,如理想汽車、百度將自家大模型應(yīng)用于自家汽車產(chǎn)品等;另一類是外部廠商提供大模型給車企,比如華為盤古大模型、百度文心一言等用于給其他車企使用。
相較通用大模型來說,垂直領(lǐng)域的大模型訓(xùn)練和使用成本更低,或許會成為更容易實現(xiàn)商業(yè)化落地的領(lǐng)域。業(yè)內(nèi)人士分析稱,汽車有著明確的交互需求,且相較于通用大模型,垂直領(lǐng)域的應(yīng)用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大。因此,無論是傳統(tǒng)車廠還是新勢力,抑或是大模型科技廠商,普遍認(rèn)為智能汽車最有可能成為率先實現(xiàn)大模型落地的B端場景。
大模型規(guī)模上車時機(jī)尚未成熟
目前來看,盡管ChatGPT的首發(fā)“上車”,已經(jīng)拉開了智能汽車領(lǐng)域大模型較量的序幕。但現(xiàn)階段距離大模型的真正規(guī)模上車,也還有一段距離。
首先,車企做大模型,多模態(tài)數(shù)據(jù)的收集、處理、訓(xùn)練本身是一個難題。自動駕駛所需傳感器數(shù)據(jù)包括激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá),以及高清攝像頭、GPS等。這些數(shù)據(jù)來自不同的坐標(biāo)系,帶有不同的觸發(fā)時間戳,且要考慮到硬件損壞等問題;同時,需要大量的場景數(shù)據(jù),比如交通標(biāo)志線、交通流、行為模型等。這讓汽車大模型的研發(fā)、訓(xùn)練門檻變得很高。
業(yè)內(nèi)人士認(rèn)為,模型數(shù)據(jù)調(diào)動管理需要利用智能網(wǎng)聯(lián)汽車以及計算技術(shù)平臺、云控技術(shù)平臺等諸多平臺,只有做到海量數(shù)據(jù)匯聚才可以做交叉,尤其是垂直領(lǐng)域,這和車內(nèi)的其他系統(tǒng)并不相同,假如基礎(chǔ)的平臺能力不能打通,其很難向更深層次發(fā)展。另外,盡管生成式AI在信息獲取上獲得了突破,但在決策、執(zhí)行控制層面,其離真正在汽車上落地還有較大的距離。
另外,端到端的AI大模型訓(xùn)練,需要在智能汽車中構(gòu)建全新的基于AI大模型的全新算法,這也需要一個過程,業(yè)內(nèi)人士認(rèn)為至少需要3—5年甚至更長的時間,來完成這一過程。
其次,受限于車載設(shè)備的硬件條件,汽車內(nèi)大模型所需要的硬件配置可能會受到限制,難以有效發(fā)揮好作用。具體來說,大模型需要高規(guī)格的硬件配置,包括高性能計算能力、大容量內(nèi)存和低時延等特點(diǎn),但車載設(shè)備的硬件條件相對有限,無法提供足夠的算力資源支撐大模型運(yùn)行。比如,在自然語言處理領(lǐng)域的GPT-3模型,就需要數(shù)萬億TOPS的計算能力。這要求芯片的算力至少要在萬級TOPS以上,才能夠勝任大模型的計算任務(wù)。但是在車載部署場景下,芯片的算力往往只有數(shù)百TOPS,遠(yuǎn)遠(yuǎn)達(dá)不到大型模型的要求。
在此背景下,升級汽車內(nèi)的算力基礎(chǔ)設(shè)施已成必然趨勢,目前來看智算中心或許會成為未來智能汽車的“標(biāo)配”。比如,特斯拉發(fā)布了獨(dú)立的云端智算中心——Dojo,總計使用了1.4萬個英偉達(dá)的GPU來訓(xùn)練AI模型。在國內(nèi),小鵬汽車與阿里云合建了智算中心“扶搖”,專門用于自動駕駛模型訓(xùn)練,算力可達(dá)到600PFLOPS;毫末智行與火山引擎聯(lián)合打造了國內(nèi)自動駕駛行業(yè)最大的智算中心“雪湖.綠洲”,每秒浮點(diǎn)運(yùn)算可達(dá)到67億億次。不過,目前這些建設(shè)還處于探索應(yīng)用階段,大模型應(yīng)用大規(guī)模上車的時機(jī),還沒有完全成熟。
底層技術(shù)才是未來角逐焦點(diǎn)
目前來看,AI大模型對汽車最本質(zhì)的改變,可能在于它將進(jìn)一步驅(qū)動汽車,從制造屬性向科技+消費(fèi)電子屬性轉(zhuǎn)變。在這種背景下,車廠本身的底層科技能力,將會成為未來的決勝關(guān)鍵。
一方面,AI大模型會重新定義“人機(jī)交互”和“服務(wù)生態(tài)”,加速汽車應(yīng)用服務(wù)生態(tài)消費(fèi)電子化,這將改變底層的產(chǎn)品定義。當(dāng)前車載語音系統(tǒng)底層是未完全成熟的任務(wù)型對話系統(tǒng),尚無法真正實現(xiàn)個性化、情感化、自由化的交互能力,而大模型可以通過深度學(xué)習(xí)+語音生成,迎來開放場景+自然交互的全新人機(jī)交互體驗。同時,在研發(fā)設(shè)計上,隨著大模型的OS化,傳統(tǒng)的APP上車、點(diǎn)觸功能、HMI交付的必要性和重要性值得思考,這意味著汽車“產(chǎn)品”的重新定義。
正如前華為自動駕駛產(chǎn)品部部長蘇箐所言:“傳統(tǒng)車廠看法首先我的基座是車,現(xiàn)在有些計算機(jī)的單點(diǎn),那么我是把車作為一個基礎(chǔ),試圖把計算機(jī)嵌進(jìn)去,這是傳統(tǒng)車廠的看法。我們的看法不一樣,基礎(chǔ)是計算機(jī),車是計算機(jī)控制的外設(shè),一個大計算機(jī)了事,把車掛上去。這是本質(zhì)看法不一樣?!笔聦嵣?,在大模型上車之后,汽車的計算中心、智能化、消費(fèi)電子屬性將變得更加明顯,其產(chǎn)品定義將遵循消費(fèi)電子的底層邏輯迭代演變(如APP化、生態(tài)服務(wù)等)。
另一方面,AI大模型將會改變汽車的現(xiàn)有算法,考慮到大模型應(yīng)用所需要的硬件成本以及外部環(huán)境來看,未來國內(nèi)企業(yè)大模型的技術(shù)實力,將更加取決于包括AI操作系統(tǒng)等在內(nèi)的底層技術(shù)。具體來說,原來汽車的自動駕駛算法較為依賴人工,而接入大模型之后,就需要依靠大模型驅(qū)動形成新的智能算法,而要構(gòu)筑這樣的算法,除了要做好產(chǎn)品,還要做好平臺。
比如,圍繞芯片、云端等在內(nèi)的計算平臺,需要做到低成本、可標(biāo)配;有了好的產(chǎn)品,才能夠有足夠多的銷量,有足夠多的銷量,才能增加“端到端”(云端到車端)的閉環(huán)數(shù)據(jù);作為基礎(chǔ)支撐的AI大算力芯片,也需要重新考慮車企自身的情況來做,回到底層來說就是誰的訓(xùn)練成本低,誰的轉(zhuǎn)化速度快,誰就將跑到最前面。
拿英偉達(dá)的訓(xùn)練芯片來說,一枚芯片被炒到了10萬塊錢,關(guān)鍵是這種高成本芯片訓(xùn)練方案,對于車企并非最優(yōu)解決辦法。而且受外部制裁影響,這種“外供依賴”隨時有可能被掐掉,脆弱性很大。因而從長遠(yuǎn)來看,車企想要在這一領(lǐng)域走到行業(yè)前列去,要么加大對底層芯片的自研力度以減少采購成本,如百度自研AI芯片,要么在AI算法、操作系統(tǒng)上去尋求破局,以找到最佳的應(yīng)用路徑。