走進博大數(shù)據(jù)位于深圳前海的智算中心,一座造型方方正正、藍白相間的建筑格外引人注目。就在這座智算中心的機房里,一排排智算機柜整齊排列,服務(wù)器高速運轉(zhuǎn),進行著復(fù)雜的數(shù)據(jù)分析與計算任務(wù)。
宋春雨/攝
“作為融合算力服務(wù)商,我們在自有的算力集群上部署了DeepSeek-R1671B全量版本供客戶使用,通過直接提供AI模型給用戶,創(chuàng)造市場上的算力需求,從而拉動我們智算中心高密機柜和算力服務(wù)的銷售。”博大數(shù)據(jù)副總裁白旭告訴證券時報記者。
隨著國產(chǎn)大模型DeepSeek火爆出圈,最近一段時間以來,來自各行各業(yè)的許多公司宣布部署DeepSeek大模型,應(yīng)用端的算力需求迎來大爆發(fā)。業(yè)內(nèi)人士分析稱,DeepSeek通過降低AI應(yīng)用門檻,推動算力需求從“訓(xùn)練主導(dǎo)”轉(zhuǎn)到“推理主導(dǎo)”。面對嶄新的行業(yè)變局,智算中心需加快轉(zhuǎn)型,從簡單的算力提供商轉(zhuǎn)向?qū)I(yè)服務(wù)商,提供覆蓋算力全生命周期的專業(yè)服務(wù),提高算力資源利用效率。
DeepSeek部署熱潮帶動算力需求提升
最近一段時間以來,企業(yè)部署DeepSeek的熱情仍然十分高漲。證券時報記者注意到,多家上市公司密集宣布已完成DeepSeek大模型的相關(guān)部署工作。
例如,海看股份2月18日在互動平臺表示,公司已在自研的AI智能審核平臺等垂類模型中部署接入DeepSeek模型,對自有平臺進行微調(diào)和優(yōu)化。同日,卓創(chuàng)資訊也發(fā)布消息稱,已完成DeepSeek系列大模型的本地化部署,且正基于DeepSeek-R1模型,運用蒸餾技術(shù),著力打造大宗商品行業(yè)大模型。
“DeepSeek很重要的一個意義,是對普通大眾進行了AI的科普及推廣。各行各業(yè)的人都知曉這款大模型,也紛紛去嘗試使用。這種集中的訪問與使用,帶動了算力需求的爆發(fā)。”中昊芯英解決方案架構(gòu)師顧立程在接受證券時報記者采訪時表示,今年春節(jié)以來,很多客戶都在詢問公司智算中心與DeepSeek的適配情況。“目前,我們的智算中心已經(jīng)能運行DeepSeek模型的各種蒸餾版本,并且表現(xiàn)都是非常不錯的?!鳖櫫⒊陶f。
宋春雨/攝
DeepSeek作為一款開源大模型,憑借高性能與低成本的優(yōu)勢,極大地降低了AI應(yīng)用的門檻,正成為下游許多AI應(yīng)用公司及終端廠商部署AI模型的優(yōu)先選項。以不久前正式接入DeepSeek-R1大模型的智慧芽為例,該公司是一家科技創(chuàng)新信息服務(wù)商,公司技術(shù)負責(zé)人告訴證券時報記者,DeepSeek等開發(fā)的開源模型,確實可以幫助企業(yè)降低前期開發(fā)投入,尤其是可以節(jié)省高昂的基礎(chǔ)設(shè)施試錯成本。
記者采訪了解到,企業(yè)的需求不僅是本地化部署DeepSeek大模型,還有許多公司會基于DeepSeek大模型,依托自有行業(yè)數(shù)據(jù)進行定制化開發(fā),訓(xùn)練垂類模型或構(gòu)建專業(yè)應(yīng)用。
“印象深刻的是一家律師事務(wù)所,客戶希望我們能協(xié)助他們利用自有的行業(yè)數(shù)據(jù)對DeepSeek進行定制化開發(fā),構(gòu)建自有的專業(yè)領(lǐng)域智能應(yīng)用,我們目前正在協(xié)同合作伙伴努力滿足客戶的需求?!卑仔癖硎?,DeepSeek有助于加速國內(nèi)企業(yè)數(shù)字化轉(zhuǎn)型,政府、金融、制造等行業(yè)客戶因AI應(yīng)用場景(如智能審批、數(shù)字孿生)的擴展,對高密機柜和邊緣算力設(shè)備的需求會大大增加。
從“訓(xùn)練主導(dǎo)”到“推理主導(dǎo)”,國產(chǎn)算力芯片廠商迎利好
訓(xùn)練成本低廉,這是DeepSeek區(qū)別于其他大模型的一大核心優(yōu)勢。雖然DeepSeek并未公開R1模型確切的訓(xùn)練成本,但根據(jù)此前V3模型發(fā)布時發(fā)表的論文,V3訓(xùn)練成本僅為557.6萬美元,約為Meta開源大模型訓(xùn)練成本的十分之一。
據(jù)記者采訪了解,大模型主要分為訓(xùn)練和推理兩個階段,訓(xùn)練是指用大量數(shù)據(jù)訓(xùn)練大模型,通常需要極高的計算能力和存儲資源;推理是指將訓(xùn)練好的模型應(yīng)用于實際任務(wù),如提問并生成文本、識別圖片與視頻等。
“傳統(tǒng)大模型訓(xùn)練如同吞噬算力的黑洞,單次訓(xùn)練成本動輒數(shù)千萬美元的巨額投入,筑起了只有科技巨頭才能逾越的技術(shù)壁壘。算力軍備競賽加劇了全球GPU資源的爭奪戰(zhàn),形成了基礎(chǔ)模型研發(fā)的高度中心化格局?!鄙虾=?jīng)邑產(chǎn)業(yè)數(shù)智研究院副院長沈佳慶向證券時報記者表示,DeepSeek打破了這種既定的秩序,將推動算力需求的重新分層,過去高度集中的訓(xùn)練算力需求會開始向應(yīng)用端的推理算力需求擴散。
“早在去年年初,我們就預(yù)判智算中心的算力需求結(jié)構(gòu)將從‘訓(xùn)練主導(dǎo)’轉(zhuǎn)向‘推理主導(dǎo)’。大模型訓(xùn)練出來后要做到有用、能用、好用,DeepSeek成功地做到了這一點從而爆火?!卑仔癖硎荆壳皣a(chǎn)算力芯片廠商與國內(nèi)OEM(原始設(shè)備制造)廠商合作推出DeepSeek一體機,國內(nèi)各大云平臺也紛紛上線DeepSeek模型服務(wù),這都大大降低了大模型應(yīng)用的使用門檻。
除了帶動推理芯片需求增長外,DeepSeek對國產(chǎn)算力芯片廠商的利好,還來自于技術(shù)層面。顧立程告訴記者,在DeepSeek推出以前,國內(nèi)大模型處于一個“百花齊放”的狀態(tài)。“中昊芯英作為一家AI芯片設(shè)計及國產(chǎn)算力硬件平臺解決方案商,涉及大量的大模型適配需求。而隨著國內(nèi)大模型的逐漸聚焦,會加速我們在算力硬件平臺及軟件大模型全國產(chǎn)解決方案上的定型與市場化?!鳖櫫⒊陶f。
事實上,自1月末以來,從云基礎(chǔ)設(shè)施服務(wù)商到國產(chǎn)算力芯片廠商,都在緊鑼密鼓地適配DeepSeek大模型。云基礎(chǔ)設(shè)施服務(wù)商方面,華為云、騰訊云、阿里云、百度云等主流的云廠商均已宣布DeepSeek相關(guān)模型上架,可供開發(fā)者部署調(diào)用,中國移動、中國電信、中國聯(lián)通三大基礎(chǔ)電信企業(yè)也全面接入DeepSeek。國產(chǎn)芯片公司也“聞風(fēng)而動”,據(jù)證券時報記者不完全統(tǒng)計,包括天數(shù)智芯、摩爾線程、海光信息、云天勵飛、壁仞科技、燧原科技、沐曦、昆侖芯等在內(nèi)的十余家國產(chǎn)芯片公司都已相繼宣布適配DeepSeek模型服務(wù)。
從提供算力到專業(yè)服務(wù),智算中心迎轉(zhuǎn)型機遇
DeepSeek的崛起,引發(fā)了人們對于未來算力需求的廣泛關(guān)注。最近一段時間以來,二級市場中的算力板塊和相關(guān)個股也迎來了較大的波動。
沈佳慶認為,短期內(nèi),由于DeepSeek降低了訓(xùn)練成本,會使得訓(xùn)練環(huán)節(jié)對大規(guī)模算力的需求出現(xiàn)下降,從而將資源投入到具體解決方案的研發(fā)?!暗虚L期來看,DeepSeek一是會提升推理、微調(diào)的算力需求,使一部分原來用于訓(xùn)練環(huán)節(jié)的閑置算力獲得應(yīng)用;二是會刺激基礎(chǔ)大模型加速迭代,對算力的需求或?qū)⒊霈F(xiàn)增長?!鄙蚣褢c表示。
業(yè)內(nèi)人士普遍認為,DeepSeek對智算中心將構(gòu)成長期利好。但在DeepSeek帶來“潑天富貴”之前,業(yè)內(nèi)對于各地踴躍建設(shè)、遍地開花的智算中心卻存有疑慮。據(jù)記者采訪了解,近年來,由于人工智能產(chǎn)業(yè)的蓬勃發(fā)展,全國掀起了規(guī)劃建設(shè)智算中心的熱潮,大大小小的智算中心如雨后春筍般在全國遍地開花。最近,國際數(shù)據(jù)公司(IDC)與浪潮信息聯(lián)合發(fā)布的《中國人工智能計算力發(fā)展評估報告》顯示,2024年中國智能算力規(guī)模同比增長了74.1%,顯示了我國在智算領(lǐng)域的大力投入。
然而,一些智算中心存在著利用程度不高、供需錯配的問題。沈佳慶分析稱,從供應(yīng)側(cè)來看,為響應(yīng)國家與地方產(chǎn)業(yè)規(guī)劃的政策導(dǎo)向,加之政府鼓勵,電信、IT軟硬件等領(lǐng)域國央企和大型民企,秉承“適度超前”的原則,開展大規(guī)模的智算中心建設(shè),導(dǎo)致市場供給出現(xiàn)井噴;從需求側(cè)來看,市場需求雖有增長,但沒有出現(xiàn)明顯井噴?!耙皇菄a(chǎn)軟硬件在效能、適用領(lǐng)域等方面還有差距,應(yīng)用效果不及預(yù)期;二是在產(chǎn)業(yè)發(fā)展初期,技術(shù)還未成熟,企業(yè)從理性角度出發(fā),購買產(chǎn)品或服務(wù)時要考慮多重因素,相對而言會比較謹慎?!鄙蚣褢c說。
算力閑置,曾困擾國內(nèi)不少智算中心,而DeepSeek或有助于緩解這一難題?!熬拖癞斈暌苿踊ヂ?lián)網(wǎng)普及一樣,當大模型真正成為大家習(xí)慣使用的工具,到時就將迸發(fā)出非常龐大的算力需求?!鳖櫫⒊瘫硎荆崆安季种撬阒行?,才能保證需求真正爆發(fā)時,智算中心能夠承載得住這“潑天的流量”。
對于智算中心而言,DeepSeek還帶來了新的發(fā)展方向和機遇。據(jù)白旭介紹,智算中心的產(chǎn)品模式已不再局限于高密機柜和算力服務(wù)的提供,而是可以直接部署模型應(yīng)用給企業(yè)使用。
“智算中心應(yīng)從簡單的以硬件建設(shè)為主,轉(zhuǎn)向以提供專業(yè)服務(wù)為主的新發(fā)展階段?!鄙蚣褢c認為,算力從一種基礎(chǔ)資源,到真正變成普遍應(yīng)用的生產(chǎn)力工具,中間還有梗阻,這些也是智算中心能夠發(fā)力的市場機遇?!巴ㄟ^提供覆蓋算力全生命周期的專業(yè)服務(wù),與產(chǎn)業(yè)鏈上不同的主體合作,提供包括算力調(diào)度、計量、優(yōu)化、微調(diào)、封裝、維護、二次開發(fā)等在內(nèi)的一攬子解決方案,將有效推動算力服務(wù)在各行各業(yè)的滲透應(yīng)用,從而擴大整個智算中心的市場需求。”沈佳慶說。
校對:王朝全???