DeepSeek:不僅是中國AI技術(shù)的里程碑
來源:證券時(shí)報(bào)網(wǎng)2025-01-28 15:08

DeepSeek因?yàn)閷γ拦傻摹氨簟毖杆僬旧鲜袌霰╋L(fēng)眼,這只“來自東方的神秘力量”引發(fā)海內(nèi)外空前的高度關(guān)注。DeepSeek的爆火,不僅是中國AI技術(shù)的里程碑,更是全球AI行業(yè)的一次“范式革命”。

這種關(guān)注是把雙刃劍。在這個(gè)過程中,DeepSeek迅速經(jīng)歷自身宕機(jī)到被攻擊的諸多事件。但這并沒有妨礙其最新開源模型的發(fā)布。

除夕,DeepSeek發(fā)布分別名為Janus-Pro等開源多模態(tài)AI模型,文生圖測試優(yōu)于OpenAI。有科技圈人士表示,這“絕對是AI行業(yè)最難眠的一夜了”。

從宕機(jī)到被攻擊

DeepSeek的輿情熱度崛起,幾乎是一夜之間。從力壓ChatGPT,登頂美區(qū)App Store 免費(fèi)榜,到國內(nèi) App Store 免費(fèi)榜,均樣位居第一。

熱度是把雙刃劍。昨晚至今日,DeepSeek連續(xù)發(fā)布聲明稱:近期 DeepSeek 線上服務(wù)受到大規(guī)模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持。

就在一日前,新模型發(fā)布后的訪問量激增,一度讓DeepSeek閃崩,但問題都在數(shù)分鐘內(nèi)得到解決。AI界上一次出現(xiàn)宕機(jī)情況,還是月之暗面的Kimi出圈爆火之時(shí)。

DeepSeek爆火的原因,在于其能與OpenAI“掰手腕”。

當(dāng)DeepSeek-V3和R1橫空出世,全球AI界仿佛被投下了一顆“技術(shù)核彈”。推出后不久,R1就憑借其性價(jià)比、開源及推理能力的提升等方面獲得了廣泛關(guān)注。DeepSeek表示,最新的AI模型可以與OpenAI的ChatGPT媲美,且開發(fā)成本遠(yuǎn)低于競爭產(chǎn)品。海外AI界評論,這是大模型行業(yè)的最大“黑馬”,在外網(wǎng)被不少人稱為“神秘的東方力量”。

這股力量在資本市場掀起巨浪。當(dāng)?shù)貢r(shí)間1月27日,美國股市開盤即大幅下跌,科技板塊尤為慘重。尤其是英偉達(dá),1月27日美股收盤,英偉達(dá)股價(jià)暴跌17%。

對此,英偉達(dá)方面回應(yīng)稱:“DeepSeek是一項(xiàng)卓越的人工智能進(jìn)展,也是測試時(shí)擴(kuò)展的絕佳范例。DeepSeek的研究展示了如何運(yùn)用該技術(shù),借助廣泛可用的模型以及完全符合出口管制規(guī)定的算力,創(chuàng)建新模型。推理過程需要大量英偉達(dá)GPU和高性能網(wǎng)絡(luò)。如今我們有三條擴(kuò)展定律:持續(xù)適用的預(yù)訓(xùn)練和后訓(xùn)練定律,以及新的測試時(shí)擴(kuò)展定律?!?/p>

根據(jù)初步統(tǒng)計(jì),隨著英偉達(dá)股價(jià)的暴跌,黃仁勛的身家大幅縮水210億美元。

此外,還有報(bào)道表示,美國總統(tǒng)特朗普在佛羅里達(dá)州邁阿密舉行的共和黨會(huì)議上表示,中國人工智能初創(chuàng)公司DeepSeek的崛起應(yīng)當(dāng)為美國企業(yè)敲響“警鐘”,美國公司“需要專注于競爭以贏得勝利?!?/p>

又推新模型

1月28日凌晨,人工智能社區(qū)Hugging Face顯示,DeepSeek剛剛發(fā)布了開源多模態(tài)人工智能模型Janus-Pro,擁有10億和70億參數(shù)規(guī)模。其中Janus-Pro-7B在GenEval和DPG-Bench基準(zhǔn)測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。

這個(gè)模型既能讓AI讀圖(基于SigLIP-L),又能讓AI生圖(借鑒LlamaGen),分1.5B和7B兩個(gè)大小。對比來看,GPT-4o的圖片生成多模態(tài)模型至今沒開放。

主流市場分析認(rèn)為,作為中國人工智能初創(chuàng)公司的DeepSeek,其最新突破動(dòng)搖了美國科技行業(yè)的“無敵”地位。

那么,DeepSeek究竟厲害在哪?低成本、高性能、開源是外界提到的高頻詞。

實(shí)際上,在推出后不久,R1就憑借其開源的性質(zhì)、大幅下降的售價(jià)和訓(xùn)練成本獲得了廣泛關(guān)注。作為一款開源模型,R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)等。

同時(shí),R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,在2048塊英偉達(dá)H800 GPU(針對中國市場的低配版GPU)集群上運(yùn)行55天完成。

這是個(gè)什么概念?557.6萬美元,僅是OpenAIGPT-4o模型訓(xùn)練成本的不到十分之一。因此,這有望引發(fā)行業(yè)重估大模型成本——有一種分析認(rèn)為,大模型和算力這兩個(gè)親兄弟,有望從此分道揚(yáng)鑣。

據(jù)統(tǒng)計(jì),2024年1—8月,微軟、Meta、谷歌、亞馬遜總計(jì)向AI數(shù)據(jù)中心投入1250億美元,包括AI資本支出、總數(shù)據(jù)中心運(yùn)營成本,現(xiàn)金運(yùn)營費(fèi)用、軟件、折舊和電費(fèi)也納入統(tǒng)計(jì)。預(yù)計(jì)2024年美國四大科技巨頭全年投入約2180億美元。而隨著DeepSeek的發(fā)布,會(huì)否引發(fā)市場對科技巨頭越來越多AI投入的質(zhì)疑,值得關(guān)注。

量化基金轉(zhuǎn)型“AI拼多多”

在國內(nèi)7家頭部的大模型創(chuàng)業(yè)公司當(dāng)中,DeepSeek可以說是最不顯山不露水的一家。另一方面,雖然市場是從最近才開始突然關(guān)注DeepSeek,但是它卻是中國AI界的老面孔。

最受關(guān)注的事件之一,就是去年引爆的“大模型價(jià)格戰(zhàn)”。

去年5月,字節(jié)跳動(dòng)宣布旗下豆包主力模型,輸入價(jià)格為0.0008元/千Tokens。6天后,阿里巴巴宣布通義千問主力模型大幅降價(jià),主力模型Qwen-Long,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,直降97%。此后,百度跳過降價(jià),直接宣布,旗下大模型文心一言的兩款入門級產(chǎn)品ERNIE Speed和ERNIE Lite免費(fèi)。大模型價(jià)格戰(zhàn)戰(zhàn)火點(diǎn)燃。

雖然市場普遍關(guān)注大廠,但實(shí)際上,DeepSeek與智譜AI的入門級大模型降價(jià)得更早。去年5月7日DeepSeek就曾宣布將旗下大模型DeepSeek-V2的價(jià)格降到了每百萬token輸入1元、輸出2元(32K上下文)。

對此,幻方創(chuàng)始人梁文鋒曾回應(yīng)稱,“大廠的模型成本比DeepSeek高很多,所以DeepSeek沒想到會(huì)有人虧錢做這件事,最后就變成了互聯(lián)網(wǎng)時(shí)代的燒錢補(bǔ)貼的邏輯?!?/p>

再往前回溯,DeepSeek被視為量化基金轉(zhuǎn)型人工智能的典型代表。

在DeepSeek背后是量化私募巨頭幻方,也是大廠外唯一一家儲(chǔ)備上萬張英偉達(dá) A100芯片的公司?;梅娇偛课挥诤贾?,專注于利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)技術(shù)進(jìn)行金融市場的量化分析和交易。相當(dāng)一段時(shí)間內(nèi),還曾受到負(fù)面輿情的困擾。

此后,DeepSeek-V2發(fā)布,主流判斷認(rèn)為,幻方量化轉(zhuǎn)型為人工智能先驅(qū),其超低價(jià)格甚至引發(fā)了國內(nèi)大模型的價(jià)格戰(zhàn),DeepSeek也被迅速冠以“AI界拼多多”之稱。

無論是DeepSeek的橫空出世,還是后來的價(jià)格戰(zhàn)戰(zhàn)火點(diǎn)燃,AI界人士普遍認(rèn)為,這反映出百度和阿里巴巴等科技巨頭,盡管在生成式人工智能領(lǐng)域已處于領(lǐng)先地位,但仍需要面對著來自新玩家的激烈競爭。

從目前來看,這種轉(zhuǎn)型不僅仍在推進(jìn),而且在這一年多時(shí)間里,DeepSeek進(jìn)展迅速。

更多故事或啟幕

“投身于探索 AGI 的本質(zhì),不做中庸的事,帶著好奇心,用最長期的眼光去回答最大的問題”,這是DeepSeek官方微信號寫下的簡介。

對于DeepSeek大火,e公司記者嘗試聯(lián)系通義千問、文心一言、騰訊等大廠,均表示“未有回應(yīng)?!庇行﹦t對記者回復(fù),會(huì)及時(shí)關(guān)注。

出圈后的DeepSeek,目前依然低調(diào)。

從產(chǎn)業(yè)生態(tài)來看,不少大模型廠商都已開啟投放買量,以期早日實(shí)現(xiàn)商業(yè)化變化。不過,記者的通過多種方式試圖聯(lián)系DeepSeek,但都未成功。多信源透露,其至今尚未有公關(guān)團(tuán)隊(duì)。

不過這反而增加了市場討論的熱情。從昨天開始,各科技群中,關(guān)于DeepSeek的討論不絕于耳。有人問:“今年春晚,(DeepSeek)會(huì)不會(huì)露下臉?

業(yè)內(nèi)普遍認(rèn)為,DeepSeek的進(jìn)展顯示出,美國的領(lǐng)先優(yōu)勢正在縮小,各國應(yīng)該采取合作方式建設(shè)先進(jìn)AI,而不是在AI領(lǐng)域進(jìn)行“軍備競賽”。

不過也有觀點(diǎn)認(rèn)為,客觀來看,雖然DeepSeek勢頭驚人,但其技術(shù)目前仍落后于OpenAI和谷歌。爆火出圈后,DeepSeek未來可能將面臨更多的壓力和挑戰(zhàn)。

但不可否認(rèn)的是,衍生影響仍將蔓延。有AI界人士接受e公司記者采訪時(shí)預(yù)判,不止是中國,世界上很多AI公司本來因?yàn)榇竽P陀?xùn)練的高昂成本,已經(jīng)放棄了自研大模型。現(xiàn)在看到DeepSeek的成功,未來有望繼續(xù)研究起來。

從這個(gè)意義來看,DeepSeek的爆火,不僅是中國AI技術(shù)的里程碑,更是全球AI行業(yè)的一次“范式革命”。

從更廣闊的視野來看,DeepSeek代表了中國“硬核技術(shù)創(chuàng)新”的一種敘事。而除了DeepSeek之外,市場還在關(guān)注更多類似的中國科技硬核力量。隨著DeepSeek的爆火,包括人形機(jī)器人公司宇樹科技等,也都在被市場寄予更多期待。

責(zé)任編輯: 陳麗湘
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號,即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場
暫無評論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換