AI算力需求涌向模型推理,國(guó)產(chǎn)芯片站上競(jìng)技臺(tái)了
來(lái)源:第一財(cái)經(jīng)作者:鄭栩彤2025-05-28 15:34

剛剛結(jié)束的COMPUTEX電腦展上,英偉達(dá)CEO黃仁勛笑著對(duì)聽(tīng)眾說(shuō),“你(芯片)買得越多,賺得越多?!币齺?lái)一陣笑聲。

這句話的背景是,全球科技廠商在AI熱潮下繼續(xù)重金投入建設(shè)數(shù)據(jù)中心或算力中心。黃仁勛在演示文檔上寫著,英偉達(dá)正在驅(qū)動(dòng)全球萬(wàn)億美元級(jí)別的企業(yè)AI IT投資。

數(shù)據(jù)中心建設(shè)熱潮下,現(xiàn)在看來(lái),AI算力需求的變化與年初一些業(yè)內(nèi)人士預(yù)計(jì)的不太一樣。DeepSeek對(duì)訓(xùn)練算力資源的節(jié)約,并未讓整體算力需求減少。

不過(guò),還有一個(gè)變化發(fā)生了,隨著DeepSeek推動(dòng)AI走向應(yīng)用,用于推理的AI芯片占比正在升高。

市場(chǎng)研究機(jī)構(gòu)IDC中國(guó)副總裁周震剛告訴第一財(cái)經(jīng)記者,2024年中國(guó)數(shù)據(jù)中心加速卡中已有半數(shù)以上是推理卡,DeepSeek出現(xiàn)后,今年推理芯片占比預(yù)計(jì)還會(huì)增加。

這種芯片結(jié)構(gòu)變化,可能會(huì)對(duì)AI芯片市場(chǎng)造成深遠(yuǎn)影響,特別是在中國(guó)市場(chǎng)。推理環(huán)節(jié)對(duì)AI芯片性能等的要求較低,國(guó)產(chǎn)AI芯片也可以使用,在英偉達(dá)出口受到限制的情況下,可能促成國(guó)內(nèi)AI芯片的組成發(fā)生變化。

周震剛透露,去年國(guó)內(nèi)數(shù)據(jù)中心加速卡市場(chǎng)中,國(guó)產(chǎn)算力占比大約三成,預(yù)計(jì)今年上半年占比應(yīng)該會(huì)超四成。

第一財(cái)經(jīng)記者了解到,這波數(shù)據(jù)中心或算力中心建設(shè)潮中,需求方來(lái)自高校、企業(yè)等,AI應(yīng)用十分多元。而面向算力需求的變化,已有算力中心在計(jì)劃調(diào)整芯片,使芯片組成更加多元、向模型推理傾斜。

算力需求來(lái)自哪里

數(shù)據(jù)中心或算力中心建設(shè)還在進(jìn)行。IDC數(shù)據(jù)顯示,中國(guó)加速計(jì)算服務(wù)器市場(chǎng)出貨量2024年同比增長(zhǎng)97.3%,預(yù)計(jì)2025年增長(zhǎng)52.9%。

在中國(guó)招標(biāo)投標(biāo)公共服務(wù)平臺(tái),第一財(cái)經(jīng)記者以智算中心為關(guān)鍵詞搜索中標(biāo)信息發(fā)現(xiàn),截至今年5月26日,今年國(guó)內(nèi)智算中心中標(biāo)信息123條,是去年前5個(gè)月的2.2倍。這些信息圍繞智算服務(wù)器設(shè)備采購(gòu)、運(yùn)維服務(wù)、電力模塊采購(gòu)、勘探、基建供配電工程施工等。

從中標(biāo)信息數(shù)量看,國(guó)內(nèi)智算中心建設(shè)提速是持續(xù)的過(guò)程。2023年國(guó)內(nèi)智算中心中標(biāo)信息53條,2024年猛增至213條。2024年上半年中標(biāo)信息71條,下半年增加至142條,顯示當(dāng)年建設(shè)項(xiàng)目也在增多。

記者了解到,一些企業(yè)和高校有了更多算力需求,部分高校自購(gòu)算力卡,部分購(gòu)買云算力或超算中心算力。

香港科技大學(xué)馮諾依曼研究院院長(zhǎng)賈佳亞告訴第一財(cái)經(jīng)記者,學(xué)校此前購(gòu)買了一批英偉達(dá)H800計(jì)算卡,香港只有香港科技大學(xué)有相對(duì)較多的H800,這是能將該研究院做成較大規(guī)模的背景。即便如此,有算力提供方告訴記者,該校在訓(xùn)練大模型,需求比較大,自己的算力不夠,也需要其他算力來(lái)源。

近日華東理工大學(xué)則與騰訊云合作,推動(dòng)AI與學(xué)科融合及科學(xué)研究降本增效等。該校副校長(zhǎng)王慧鋒告訴記者,高校科研對(duì)AI算力的需求增長(zhǎng)是必然,該校也在探索AI+科學(xué)研究,例如有化學(xué)老師將AI算法用于鋰電池催化設(shè)計(jì),并將設(shè)計(jì)理念提煉出來(lái)做成智能體知識(shí)庫(kù),用于實(shí)踐教學(xué)。目前學(xué)校采用混合云架構(gòu),部分算力本地化部署,另有大量計(jì)算放到云上,上云而不是完全自建機(jī)房的做法成本更優(yōu)。王慧鋒告訴記者,考慮到需求和數(shù)據(jù)安全等,目前高校采用私有和混合架構(gòu)的模式是主流。

去年12月,香港規(guī)模最大的數(shù)碼港人工智能超算中心投入服務(wù),香港為申請(qǐng)使用者提供資助。記者了解到,申請(qǐng)使用該超算中心首階段算力的主體就包括大學(xué)和科研機(jī)構(gòu)。

數(shù)碼港行政總裁鄭松巖告訴記者,該超算中心目前有1300PFLOPS算力,第二階段規(guī)劃算力是1700PFLOPS,今年10月該超算中心算力將提升到3000PFLOPS。目前已審批通過(guò)10個(gè)申請(qǐng),這些申請(qǐng)來(lái)自大學(xué)、科研機(jī)構(gòu)、企業(yè),用途包括學(xué)術(shù)研究、生物醫(yī)療、材料分析、大模型應(yīng)用等,到本月底,第一階段的算力使用率將超95%,預(yù)計(jì)接下來(lái)的申請(qǐng)會(huì)越來(lái)越多。

“一些大學(xué)在做教學(xué)相關(guān)項(xiàng)目,一些在研究可商業(yè)化的項(xiàng)目。有的大學(xué)在研究生物科學(xué)相關(guān)領(lǐng)域,也需要比較大的算力。目前不少大學(xué)是以開(kāi)發(fā)項(xiàng)目為主來(lái)申請(qǐng),個(gè)別大學(xué)會(huì)捆綁幾個(gè)小項(xiàng)目一起申請(qǐng),讓學(xué)生做一些研究?,F(xiàn)在有算力基本是先到先得?!?鄭松巖表示。

企業(yè)也需要算力。鄭松巖告訴記者,企業(yè)應(yīng)用處于剛開(kāi)始嘗試的階段,可以感受到很多企業(yè)還沒(méi)有下很大決心要完成整個(gè)機(jī)構(gòu)的轉(zhuǎn)型,或?yàn)榇藬M定非常嚴(yán)格的時(shí)間節(jié)點(diǎn)?!扒岸螘r(shí)間處于一種想用AI,但很多企業(yè)還沒(méi)啟動(dòng)的階段。很多企業(yè)都想用AI來(lái)提高效率、降低成本,但AI要直接嵌入企業(yè)日常流程中,企業(yè)實(shí)際上缺乏相應(yīng)人才配套?!编嵥蓭r表示,香港的人工智能應(yīng)用爆發(fā)期還沒(méi)到來(lái),隨著業(yè)界對(duì)AI越來(lái)越熟悉,接下來(lái)預(yù)計(jì)應(yīng)用會(huì)越來(lái)越多。

算力向推理傾斜

DeepSeek帶來(lái)的算力需求增長(zhǎng),是大模型推理對(duì)大模型訓(xùn)練的一場(chǎng)“勝利”。過(guò)去兩年,大模型業(yè)界最受關(guān)注的一直是訓(xùn)練環(huán)節(jié)。但開(kāi)源且性能出眾的DeepSeek-R1面世后,更多人開(kāi)始真正將大模型用起來(lái),促使推理需求增長(zhǎng)。

這讓一些適合推理的芯片用了起來(lái)。周震剛向記者表示,去年國(guó)內(nèi)互聯(lián)網(wǎng)公司、電信運(yùn)營(yíng)商采購(gòu)了大量國(guó)產(chǎn)算力卡,但去年采購(gòu)方發(fā)現(xiàn),國(guó)產(chǎn)算力資源不是很好出售。而隨著今年上半年DeepSeek應(yīng)用推開(kāi),尤其是國(guó)產(chǎn)算力適配DeepSeek后,此前它們采購(gòu)的國(guó)產(chǎn)算力在今年第一季度已經(jīng)被DeepSeek占有了。目前電信運(yùn)營(yíng)商已在建設(shè)新的大規(guī)模算力中心,包括基于國(guó)產(chǎn)算力的萬(wàn)卡集群。

騰訊是國(guó)內(nèi)最早接入DeepSeek的互聯(lián)網(wǎng)廠商之一。該公司在5月的業(yè)績(jī)交流會(huì)上釋放過(guò)推理需求增長(zhǎng)的信號(hào)。

騰訊管理層表示,騰訊有足夠的高端芯片來(lái)繼續(xù)訓(xùn)練模型,公司看到對(duì)GPU更大的需求是在推理側(cè)。用戶推理需求逐漸增長(zhǎng),推理token(詞元)的需求比之前預(yù)計(jì)的更多,AI需求已經(jīng)超過(guò)了GPU資源(所能提供的算力)。

周震剛也發(fā)現(xiàn),DeepSeek出現(xiàn)確實(shí)讓算力需求改變了,主要是改變了算力需求的結(jié)構(gòu)。他告訴記者,2024年,中國(guó)數(shù)據(jù)中心加速卡有57.6%是推理卡,33%是訓(xùn)練卡。而在DeepSeek出現(xiàn)后,一些小型公司的算力從訓(xùn)練轉(zhuǎn)到推理。騰訊、百度這類平臺(tái)接入DeepSeek也大大推動(dòng)了推理芯片的增長(zhǎng),因此預(yù)計(jì)2025年推理芯片占比還會(huì)進(jìn)一步大幅增加。

鄭松巖告訴記者,數(shù)碼港的人工智能超算中心也在考慮改變算力組成。

“一開(kāi)始我們主要面向模型訓(xùn)練需求,包括很多大學(xué)那時(shí)候要做模型訓(xùn)練,但實(shí)際上,近一年來(lái)模型變化很大?!?鄭松巖告訴記者,此前很多機(jī)構(gòu)在做基礎(chǔ)大語(yǔ)言模型,但在DeepSeek出來(lái)后放棄了這一路線,轉(zhuǎn)向使用DeepSeek等基礎(chǔ)大模型,“我們認(rèn)為未來(lái)做基礎(chǔ)大模型的團(tuán)隊(duì)會(huì)逐漸減少,轉(zhuǎn)向以推理為主,人工智能超算中心的第二階段正在建構(gòu)中,接下來(lái)做安裝、配置、設(shè)計(jì)時(shí)會(huì)更多考慮這部分需求。”

鄭松巖告訴記者,推理環(huán)節(jié)對(duì)芯片算力的要求相對(duì)沒(méi)那么大,因此,算力不及英偉達(dá)H100、H800的芯片都有可能引進(jìn)。

芯片組成變了

推理需求增長(zhǎng)讓國(guó)產(chǎn)算力站上競(jìng)技的舞臺(tái)了。

周震剛告訴記者,2022年和2023年,英偉達(dá)占中國(guó)數(shù)據(jù)中心加速卡市場(chǎng)的85%~90%,國(guó)產(chǎn)算力沒(méi)有太大空間,但在美國(guó)政策、國(guó)內(nèi)市場(chǎng)變化等因素影響下,國(guó)產(chǎn)算力占比已有大幅提升。

具體而言,2024年中國(guó)數(shù)據(jù)中心加速卡市場(chǎng)中,有65.2%是英偉達(dá),34.6%是國(guó)產(chǎn)算力?!拔覀儸F(xiàn)在看到,今年上半年國(guó)產(chǎn)算力占比應(yīng)該會(huì)超四成,很可能在很短的時(shí)間內(nèi),國(guó)產(chǎn)算力會(huì)成為主流,占比超50%。這個(gè)比例在兩年前是無(wú)法想象的。”周震剛表示。

在大模型算力需求以訓(xùn)練為主的時(shí)候,之所以國(guó)產(chǎn)芯片還難以挑戰(zhàn)英偉達(dá)的地位,既有英偉達(dá)芯片算力高、生態(tài)好、集群大等原因,也有訓(xùn)練難以兼容異構(gòu)芯片的原因。周震剛向記者解釋,訓(xùn)練時(shí)難以同時(shí)用英偉達(dá)+國(guó)產(chǎn)芯片組成的資源池,只能將訓(xùn)練分成兩部分,一部分用英偉達(dá)卡,一部分用國(guó)產(chǎn)卡,但這種訓(xùn)練的效率較低,因此大部分訓(xùn)練現(xiàn)在仍跑在英偉達(dá)卡上,只有少數(shù)AI廠商基于國(guó)產(chǎn)卡算力平臺(tái),更多廠商還是在用國(guó)產(chǎn)芯片做測(cè)試性工作,作為備用方案。但推理可以跑在國(guó)產(chǎn)芯片上,“可以根據(jù)需求,把面向某個(gè)應(yīng)用的推理或面向某個(gè)區(qū)域用戶的推理放到國(guó)產(chǎn)芯片上,可以這么分解?!?/p>

“過(guò)去別人會(huì)問(wèn)(國(guó)產(chǎn)芯片廠商),你跟英偉達(dá)H100相比優(yōu)勢(shì)在哪里、性價(jià)比如何、生態(tài)能否兼容?現(xiàn)在這些問(wèn)題已經(jīng)沒(méi)有太大影響了?!庇袠I(yè)界分析人士向記者形容,云廠商或AI廠商現(xiàn)在需要英偉達(dá)之外的更多國(guó)產(chǎn)芯片方案。除了華為與運(yùn)營(yíng)商合作,其他國(guó)內(nèi)芯片廠商也基本都有芯片出來(lái)了,云廠商也在推進(jìn)自研。周震剛表示,今年一季度需求火熱的DeepSeek一體機(jī)中,英偉達(dá)芯片占比還是較大,但已有不少基于寒武紀(jì)、沐曦等國(guó)產(chǎn)芯片。

需求也反映在國(guó)產(chǎn)AI芯片廠商業(yè)績(jī)上。此前陷于虧損的寒武紀(jì),2024年第四季度開(kāi)始盈利。今年第一季度,寒武紀(jì)營(yíng)收11.11億元,接近去年全年?duì)I收,凈利潤(rùn)3.55億元,實(shí)現(xiàn)同比扭虧。

還有算力中心正在考慮國(guó)產(chǎn)芯片方案,鄭松巖告訴記者,推理不需要用到太“高級(jí)”的芯片。數(shù)碼港有一個(gè)人工智能實(shí)驗(yàn)室,正在測(cè)試不同的芯片,除了英偉達(dá),還測(cè)試國(guó)產(chǎn)的華為、沐曦、壁仞、昆侖芯等。同時(shí),實(shí)驗(yàn)室也在測(cè)試異構(gòu)算力調(diào)度平臺(tái),希望能通過(guò)一個(gè)平臺(tái)統(tǒng)一調(diào)度不同芯片算力。

騰訊高管則在5月的業(yè)績(jī)交流會(huì)上表示,公司會(huì)同時(shí)看進(jìn)口芯片和國(guó)內(nèi)市面上可用的芯片,在某些情況下,其中一些芯片能做較小模型的推理。

作為AI芯片巨頭,英偉達(dá)近期感到緊張不是沒(méi)有道理的。今年4月,英偉達(dá)公告稱,美國(guó)政府已告知,對(duì)于H20芯片及達(dá)到H20內(nèi)存帶寬等的其他芯片,若出口至中國(guó)等國(guó)家和地區(qū)需獲得許可證。H20是英偉達(dá)針對(duì)中國(guó)市場(chǎng)推出的“特供”版本。

黃仁勛近日表態(tài)稱,這種人工智能芯片出口管制是失敗的,“事實(shí)證明,最初制定人工智能擴(kuò)散規(guī)則的那些基本假設(shè)存在根本性缺陷”。他表示,英偉達(dá)在中國(guó)市場(chǎng)的份額已從美國(guó)前總統(tǒng)拜登執(zhí)政初期的95%降至目前的50%。中國(guó)人工智能市場(chǎng)規(guī)??赡茉谖磥?lái)兩到三年內(nèi)達(dá)到約500億美元,對(duì)一家美國(guó)公司來(lái)說(shuō),無(wú)法進(jìn)入這一市場(chǎng)將是巨大的損失。

英偉達(dá)還在嘗試應(yīng)對(duì)中國(guó)市場(chǎng)上的競(jìng)爭(zhēng)。近日有消息稱,英偉達(dá)擬新推出一款面向中國(guó)市場(chǎng)的AI芯片,采用最新的Blackwell架構(gòu),定價(jià)低于H20,最早于今年6月量產(chǎn),英偉達(dá)官方尚未證實(shí)該消息。

責(zé)任編輯: 鄧衛(wèi)平
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無(wú)評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換