從訓(xùn)練到推理 芯片戰(zhàn)場新角逐
來源:21世紀(jì)經(jīng)濟報道作者:倪雨晴2025-01-17 11:01

2025年的CES刮起AI旋風(fēng)。

AI Agent的興起、AI硬件的火熱,都反映了AI應(yīng)用正在加速爆發(fā)。隨著應(yīng)用走進千行百業(yè),大模型和算力市場雙雙掀開新篇章。

一方面,AI大模型更強化商用探索,從訓(xùn)練轉(zhuǎn)向了推理,如果將訓(xùn)練看作是AI模型的研發(fā)建設(shè)階段,那么推理便是模型商業(yè)化落地的核心階段。不論是OpenAI o1、Gemini 2.0 Flash Thinking,還是DeepSeek R1-Lite-Preview,都在提升推理能力,進一步支撐應(yīng)用開發(fā)。

另一方面,隨著AI推理來到了聚光燈下,成為行業(yè)焦點,AI算力的市場上,對推理基礎(chǔ)設(shè)施的需求正在上升。

巴克萊研報指出,目前,AI推理計算需求將快速提升,預(yù)計其將占通用人工智能總計算需求的70%以上,推理計算的需求甚至可以超過訓(xùn)練計算需求,達到后者的4.5倍。

在AI推理的新時代,芯片廠商們正在開啟新策略。從CES上的動作來看,英偉達可謂激進,直接在端側(cè)推出超級計算機Project DIGITS,以“PC主機”的形態(tài)讓個人用戶可以運行模型推理,開發(fā)AI應(yīng)用。

可以說,Project DIGITS直接在終端計算上開辟了新戰(zhàn)線。而云端的戰(zhàn)場上,推理芯片的競賽正在拉開大幕,英偉達、AMD酣戰(zhàn)外,云廠商、初創(chuàng)企業(yè)都在尋找推理的生存路徑。

端側(cè)AI崛起:英偉達的2C“芯”

首先從端側(cè)看,Project DIGITS搭載全新GB10超級芯片,成為全球最小的可運行200B參數(shù)模型的AI超級計算機。

在生成式AI應(yīng)用的爆發(fā)前夜,英偉達要將它的算力網(wǎng)進一步鋪開,如今它已經(jīng)將生成式AI鋪到了開發(fā)者的桌面上。

英偉達似乎在展示生成式AI時代,AI PC的未來模樣。盡管DIGITS作為初代產(chǎn)品,主要面向的還是研發(fā)人員、科學(xué)家、開發(fā)者,但是它向我們展示了更強大的個人算力使用場景,為端側(cè)AI的發(fā)展提供了新的可能。

這種設(shè)計,不僅為開發(fā)者提供了更加便捷、高效的工具,也進一步降低了AI算力應(yīng)用的門檻。英偉達試圖通過這一戰(zhàn)略,將生成式AI從云端拉向終端,從高成本的少數(shù)派應(yīng)用,轉(zhuǎn)向更具普及性的AI。

當(dāng)然,英偉達并非唯一玩家,在CES上,AMD、高通、英特爾等廠商同樣在端側(cè)AI領(lǐng)域積極布局。

以AMD為例,其推出的銳龍AI Max系列移動處理器,憑借集成的新一代神經(jīng)處理單元(NPU),在Windows筆記本市場表現(xiàn)不俗。而基于“Zen 5”架構(gòu)的銳龍AI 300系列,則進一步增強了多任務(wù)處理能力和續(xù)航時間,從輕薄筆記本到日常辦公電腦,AMD正試圖在不同市場細(xì)分領(lǐng)域拓展份額。

與此同時,英特爾也推出了一系列CPU,包括酷睿Ultra 200V系列、Ultra 200H系列、Ultra 200HX系列、Ultra 200U系列、Ultra 200S系列。這些細(xì)分的CPU,涵蓋從高性能到入門級的不同應(yīng)用場景。而高通則通過Snapdragon X入門級處理器,嘗試將AI技術(shù)下沉至價格更加親民的筆記本市場,使OEM能夠在600美元左右的范圍內(nèi)銷售Copilot+電腦。

對比來看,同樣是針對AI PC,不論是AMD、英特爾還是高通,更多的是繼續(xù)在芯片層面更新,但是英偉達已經(jīng)另辟蹊徑,探索軟硬件一體化的新AI PC賽道。

或者說,“賣鏟子”的英偉達始終有一顆2C的“芯”??v觀英偉達的歷史,很早就希望做一家to C的公司,比如說之前做游戲主機。但現(xiàn)實卻是相反,英偉達走上了算力提供方的角色道路,越來越像一家純粹to B的公司。

兜兜轉(zhuǎn)轉(zhuǎn),在AI PC領(lǐng)域,英偉達再次回到C端市場,對產(chǎn)業(yè)鏈進行了整合。從Arm架構(gòu)到GPU、CPU的整合,對于英偉達而言,是自身產(chǎn)品能力的外溢,現(xiàn)有的技術(shù)框架支撐英偉達開啟新產(chǎn)品線。

從另一個角度來說,現(xiàn)在很多人買一臺電腦,主要就是買一張顯卡,英偉達也是在橫向擴展自己的產(chǎn)品線。面向未來的AI PC市場,我們可能不會為了惠普、戴爾這些品牌而產(chǎn)生高溢價的購買行為,相反,英偉達憑借在PC用戶中的號召力,已經(jīng)和這些巨頭有絕對的一戰(zhàn)之力。

對比來看,英特爾或者別的算力公司也始終在嘗試更多的業(yè)態(tài)和技術(shù)路線,但是在業(yè)內(nèi)人士看來,要打敗英偉達一定不是通過英偉達,而是要有下一個時代的技術(shù)方向和路徑,不能再用上一代的車去開下一代的路。

從目前來看,英偉達的戰(zhàn)略路線非常清晰,不斷的通過軟件加硬件以及現(xiàn)在的to C成品產(chǎn)品來形成自己的端側(cè)壁壘。英特爾、AMD等對手能否超車,也取決于他們是否能在下一代計算方向上占據(jù)先機。

不論競爭態(tài)勢如何,端側(cè)AI的崛起,都標(biāo)志著算力進入了新的階段。從數(shù)據(jù)中心到個人桌面,從企業(yè)用戶到普通消費者,AI的未來正在變得更加觸手可及。

AI推理時代:創(chuàng)新在“邊緣”

DIGITS是英偉達開啟的終端側(cè)創(chuàng)新產(chǎn)品線,而當(dāng)前AI的增長仍主要在云端。尤其是,隨著推理需求越來越旺盛,推理計算的競爭也更加激烈。AI訓(xùn)練市場上英偉達占據(jù)九成市場,但是AI推理市場在打開更多空間。

在2024年10月,英偉達管理層在AI路演上就特別提到了推理帶來的市場。高管表示,當(dāng)前仍是AI周期的早期階段,隨著OpenAI o1模型的發(fā)布,新的AI敘事正在展開,開始轉(zhuǎn)向解決更復(fù)雜的推理問題,這將提升對硬件組合的需求,而英偉達即將推出的機架產(chǎn)品是最佳解決方案。

從英偉達的視角看,當(dāng)前英偉達最新架構(gòu)的Blackwell架構(gòu)芯片已經(jīng)全面投產(chǎn),隨著AI應(yīng)用走向千行百業(yè),英偉達提供更多的配置來滿足算力需求。

比如,在CES上,英偉達就展示了GNVL72大芯片,樣品由72個Blackwell GPU構(gòu)成,主要是針對更大的算力需求、更低的能耗要求進行了升級。而GB200引入了先進的功能和第二代Transformer引擎,可加速LLM推理工作負(fù)載,據(jù)悉新一代的GB300將對推理模型會有更好的支持。

與此同時,推理市場上的競爭者著實不少。比如科技大廠AWS、谷歌、微軟,各家的ASIC芯片、TPU芯片也在不斷迭代之中;又比如Groq、SambaNova、Positron AI等初創(chuàng)企業(yè),大家都想從推理中分一杯羹。

英偉達在訓(xùn)練市場的絕對壟斷地位,使得其他玩家很難直接切入這一領(lǐng)域,因此推理市場成為諸多初創(chuàng)公司和競爭者的關(guān)注焦點。此前,推理市場像是算力界的“邊緣”市場,而現(xiàn)在,推理市場逐步成為了行業(yè)焦點,更多的創(chuàng)新在這里涌現(xiàn)。

在這一市場中,差異化競爭正在形成。例如,一些企業(yè)專注于開發(fā)針對推理場景優(yōu)化的專用芯片,以在特定工作負(fù)載下提升性能;另一些公司則嘗試通過軟硬件協(xié)同優(yōu)化,為計算場景提供更經(jīng)濟高效的解決方案。

而這也是一場殘酷的算力角逐游戲,在算力市場上面開發(fā)出新物種并非易事,因為新物種是在GPU的絕對統(tǒng)治力之下,在細(xì)分領(lǐng)域生存進化的結(jié)果。

面對推理算力需求的增長,硬件市場更加細(xì)分了,競爭也更加激烈。雖然從各種預(yù)測看,推理市場未來的增勢很大,但是眼下英偉達已經(jīng)吃掉市面上的大部分算力的利潤,推理部分的細(xì)分蛋糕,如何切割,依然是比較殘酷的競爭。

而有意思的是,當(dāng)年英偉達所處的位置也是邊緣市場。原來的GPU的生存之道是圖形計算,但是計算機的圖形計算的重要性并不是很高,它是諸多計算任務(wù)當(dāng)中的一個分支,但是它慢慢變得更重要,從邊緣進入關(guān)鍵的核心。

現(xiàn)在,推理也在從邊緣進入到中心舞臺,毫無疑問,接下來AI場上將迎來更繁榮的推理芯片和應(yīng)用生態(tài)。在未來的硬件架構(gòu)中,可能有更多組合,有專門用來做通用計算的CPU、有專門做訓(xùn)練的GPU,也有專門做推理的推理芯片。

在異構(gòu)計算中,英偉達必然是強大的算力基礎(chǔ),但對于企業(yè)而言要更換一套體系也是成本。而英偉達的競爭者們?nèi)绾瓮ㄟ^軟硬件結(jié)合等創(chuàng)新,形成細(xì)分場景的突圍路徑,也值得關(guān)注。

責(zé)任編輯: 陳勇洲
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換