英偉達(dá)、英特爾、AMD這三家從PC時(shí)代就鏖戰(zhàn)不止的芯片三巨頭,又在AI時(shí)代里正面交鋒。
作者 | 周智宇 編輯 | 張曉玲
一周漲價(jià)30%,單片售價(jià)超十萬(wàn)。人工智能的火熱,芯片的短缺,讓英偉達(dá)A800成了市場(chǎng)上炙手可熱的硬通貨。
趁此東風(fēng),英偉達(dá)CEO黃仁勛一舉成為和馬斯克并肩,最受矚目的企業(yè)家之一。英偉達(dá)的市值也飆升至1.17萬(wàn)億美元,成了市場(chǎng)上最熱門(mén)的科技公司。
然而一面是高端AI芯片的稀缺,一面則是“百模大戰(zhàn)”,下游對(duì)算力需求高漲。面對(duì)才不過(guò)剛剛起勢(shì)的市場(chǎng),大大小小的競(jìng)爭(zhēng)對(duì)手們,都在奮力追趕。它們希望打破眼下“AI芯片=英偉達(dá)”的格局,從這個(gè)萬(wàn)億級(jí)的市場(chǎng)里分得一杯羹。
就在7月11日,英特爾在北京發(fā)布了專(zhuān)供中國(guó)市場(chǎng)的AI處理器Gaudi 2,它對(duì)標(biāo)英偉達(dá)100系列,專(zhuān)為訓(xùn)練大語(yǔ)言模型而構(gòu)建。
Gaudi 2的推出,意味著AI芯片市場(chǎng)里又有一位巨頭下場(chǎng)。在英特爾之前,AMD也推出了自家的AI產(chǎn)品。英偉達(dá)、英特爾、AMD這三家從PC時(shí)代就鏖戰(zhàn)不止的芯片三巨頭,又在AI時(shí)代里正面交鋒。
AI芯片市場(chǎng)里不會(huì)一家獨(dú)大,隨著一位位巨頭入場(chǎng),一場(chǎng)全新的競(jìng)逐,開(kāi)始了。
01交鋒
借著推出Gaudi 2,英特爾向英偉達(dá)發(fā)起了正面進(jìn)攻。
PC市場(chǎng)萎縮以及數(shù)據(jù)中心業(yè)務(wù)走軟,讓英特爾業(yè)績(jī)承壓。原本是服務(wù)器芯片市場(chǎng)“一哥”的英特爾的市場(chǎng)份額,被AMD等競(jìng)爭(zhēng)對(duì)手蠶食。人工智能浪潮帶來(lái)對(duì)算力的需求,則讓英特爾看到了新的發(fā)力點(diǎn)。
Gaudi2由英特爾2019年斥資20億美元收購(gòu)的AI初創(chuàng)公司Habana Labs 設(shè)計(jì),從推出的一開(kāi)始,Gaudi平臺(tái)就是為云端和數(shù)據(jù)中心提高深度學(xué)習(xí)訓(xùn)練效率而構(gòu)建。
發(fā)布會(huì)現(xiàn)場(chǎng),英特爾公司執(zhí)行副總裁、數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera花了大量時(shí)間介紹Gaudi 2的性能,對(duì)比的對(duì)象,就是英偉達(dá)高端GPU A100和H100。
從演示的數(shù)據(jù)看,比如說(shuō)Bert模型預(yù)訓(xùn)練,Gaudi 2 的性能是英偉達(dá)A100的1.7倍。至于更先進(jìn)的英偉達(dá)H100,Habana Labs的首席運(yùn)營(yíng)官Eitan Medina表示,Gaudi 2 是目前為能夠替代英偉達(dá)H100進(jìn)行LLM訓(xùn)練的“唯一替代品”。在MLPerf 3.0 基準(zhǔn)測(cè)試中,僅有Gaudi 2 與H100能夠進(jìn)行GPT-3訓(xùn)練。
從目前的數(shù)據(jù)來(lái)說(shuō),基于 GPT-3模型訓(xùn)練,Gaudi 2與H100尚有一定差距,單個(gè)H100的性能是Gaudi 2的3.6倍。不過(guò)Eitan Medina表示,隨著9月英特爾發(fā)布對(duì)FP8的軟件支持與新功能,Gaudi2的性?xún)r(jià)比預(yù)計(jì)將超越H100。
性?xún)r(jià)比,是Gaudi 2對(duì)抗英偉達(dá)100系列的一個(gè)核心優(yōu)勢(shì)。Eitan Medina告訴華爾街見(jiàn)聞,Gaudi2在運(yùn)行ResNet-50時(shí),每瓦性能約是英偉達(dá)A100的2倍,運(yùn)行 1760 億參數(shù) BLOOMZ 模型的每瓦性能,則大概是A100 的1.6倍。
也就是說(shuō),在提供不錯(cuò)的性能的同時(shí),Gaudi 2在能耗上明顯優(yōu)于英偉達(dá)A100,并且Gaudi 2也能從性?xún)r(jià)比層面挑戰(zhàn)H100。英特爾也借此成為目前一眾英偉達(dá)的挑戰(zhàn)者中,最具競(jìng)爭(zhēng)力的對(duì)手。
盡管同A100類(lèi)似,Gaudi 2為了符合美國(guó)工業(yè)與安全局相關(guān)規(guī)定,與國(guó)際版存在差別。不過(guò)Eitan Medina表示,中國(guó)版Gaudi 2在整體性能上與國(guó)際版差別不大。明年計(jì)劃推出的5nm Gaudi 3,也會(huì)在合規(guī)的情況下,提供給中國(guó)客戶(hù)。
目前,英特爾已經(jīng)與浪潮信息、新華三和超聚變等國(guó)內(nèi)服務(wù)器廠(chǎng)商,以及百度智能云等公司展開(kāi)合作。浪潮信息副總裁、浪潮AI&HPC產(chǎn)品線(xiàn)總經(jīng)理劉軍也表示,聯(lián)合英特爾發(fā)布新一代AI服務(wù)器NF5698G7,支持8顆Gaudi2。
此外,Sandra Rivera透露,到2025年的時(shí)候,英特爾會(huì)把Gaudi的AI芯片和GPU兩條產(chǎn)品線(xiàn)進(jìn)行整合,屆時(shí)會(huì)推出一個(gè)更完整的下一代GPU產(chǎn)品。通過(guò)廣泛的產(chǎn)品線(xiàn),滿(mǎn)足各種不同的需求。
02競(jìng)逐
英特爾不是首家向英偉達(dá)發(fā)起沖鋒的芯片巨頭。
去年6月,AMD也推出CPU+GPU架構(gòu)的Instinct MI300,進(jìn)軍AI訓(xùn)練市場(chǎng)。隨后在今年6月,AMD又通過(guò)祭出高達(dá)192 GB HBM內(nèi)存的MI300X,進(jìn)一步為滿(mǎn)足大模型訓(xùn)練進(jìn)行優(yōu)化。
AMD的數(shù)據(jù)中心硬件主管Forrest Norrod稱(chēng),ChatGPT引領(lǐng)的AI熱潮讓AMD也感到意外。業(yè)內(nèi)還是迫切希望英偉達(dá)有一個(gè)競(jìng)爭(zhēng)對(duì)手,能夠在英偉達(dá)的芯片之外,還有一個(gè)替代的選項(xiàng)。
事實(shí)也是如此。日益增長(zhǎng)的大模型訓(xùn)練需求,與產(chǎn)能受限,讓英偉達(dá)充滿(mǎn)了“幸福的煩惱”。英偉達(dá)方面透露,其訂單已經(jīng)排至2024年,像H100在明年一季度之前都處于售罄狀態(tài)。
前不久的世界人工智能大會(huì)(WAIC)上,清華大學(xué)電子工程系主任汪玉也強(qiáng)調(diào)了目前算力資源的緊張。他表示,部署成本高、模型算力缺口大以及國(guó)產(chǎn)芯片生態(tài)需要擴(kuò)張和構(gòu)建,是目前大模型落地的挑戰(zhàn)。
算力需求持續(xù)增長(zhǎng),以及大模型玩家渴望通過(guò)使用更優(yōu)秀產(chǎn)品,以減少與OpenAI等廠(chǎng)商算力支持差距,都讓市場(chǎng)里對(duì)算力的需求高企。半導(dǎo)體市場(chǎng)里的玩家也隨之迎來(lái)全新的機(jī)遇。
Sandra Rivera表示,在一季度,人工智能帶來(lái)的芯片需求,讓英特爾包括Gaudi在內(nèi)的產(chǎn)品需求翻了至少兩倍。此外,在AI用例及市場(chǎng)需求爆發(fā)式增長(zhǎng)的時(shí)候,第四代至強(qiáng)處理器也有很好的市場(chǎng)回響。
按照摩根士丹利的預(yù)計(jì),包括英偉達(dá)和AMD的GPU、AI計(jì)算專(zhuān)用芯片以及這些芯片的外包生產(chǎn)在內(nèi),今年全球AI計(jì)算半導(dǎo)體市場(chǎng)年銷(xiāo)售規(guī)模大概會(huì)在430億美元。四年內(nèi),全球AI計(jì)算半導(dǎo)體市場(chǎng)銷(xiāo)售額會(huì)達(dá)到1250億美元。這在全球半導(dǎo)體受消費(fèi)電子銷(xiāo)售放緩,收入下降預(yù)期中,是一個(gè)增長(zhǎng)的亮點(diǎn)。
這個(gè)萬(wàn)億人民幣的市場(chǎng),也自然吸引了大小玩家,前赴后繼地蜂擁而入。他們相信,市場(chǎng)里不止有一個(gè)英偉達(dá)。
英偉達(dá)確實(shí)有自己的壁壘。GPU相比CPU在并行計(jì)算能力、內(nèi)存帶寬等性能和浮點(diǎn)運(yùn)算速度上具備明顯優(yōu)勢(shì),英偉達(dá)也借此在模型訓(xùn)練和推理上先行一步,領(lǐng)先了AMD和英特爾等玩家。英偉達(dá)統(tǒng)一計(jì)算設(shè)計(jì)架構(gòu)CUDA也靠著封閉的生態(tài),形成了自己的軟件生態(tài),綁定了百萬(wàn)計(jì)的開(kāi)發(fā)者。
Sandra Rivera也承認(rèn),在目前進(jìn)行人工智能、AI運(yùn)算的時(shí)候,很多人都在用CUDA。然而在她的觀察中,很多大模型的開(kāi)發(fā)者不會(huì)做這么底層的開(kāi)發(fā),會(huì)在PyTorch、TensorFlow上做創(chuàng)新。
這也是英特爾等玩家的機(jī)遇。Sandra Rivera認(rèn)為,軟件開(kāi)發(fā)或者開(kāi)發(fā)者生態(tài)一直是英特爾的強(qiáng)項(xiàng),在數(shù)據(jù)中心領(lǐng)域,除了CUDA,就是英特爾的X86軟件生態(tài)。英特爾則希望為擺脫封閉生態(tài)系統(tǒng),尋求效率與規(guī)模的的客戶(hù)提供更具競(jìng)爭(zhēng)力的選擇。
除了英偉達(dá)、AMD和英特爾三個(gè)芯片巨頭,市場(chǎng)上仍有大玩家摩拳擦掌,準(zhǔn)備下場(chǎng)。馬克·扎克伯格旗下的Meta Platforms在7月18日宣布,將攜手高通,采用高通芯片,以在手機(jī)和個(gè)人電腦上運(yùn)行Meta新大型語(yǔ)言模型Llama 2;馬斯克也在xAI會(huì)議上表示,準(zhǔn)備自研AI芯片。
在火熱的“百模大戰(zhàn)”之外,硬件端的戰(zhàn)役也已打響。傳統(tǒng)芯片巨頭和不斷涌現(xiàn)的新玩家們?cè)贏I上戰(zhàn)得火熱,如今浪潮初起,一場(chǎng)全新領(lǐng)域里的王者之爭(zhēng),方拉開(kāi)序幕。