華泰證券:DeepSeek有望加速模型訓(xùn)練與CUDA解耦
來(lái)源:人民財(cái)訊作者:王煥城2025-02-21 07:57

人民財(cái)訊2月21日電,華泰證券研究認(rèn)為,DeepSeek在V3中使用了相比CUDA更底層的PTX 來(lái)優(yōu)化硬件算法,PTX是CUDA編譯的中間代碼,在CUDA和最終機(jī)器碼之間起到橋梁作用。而NSA則使用了OpenAl提出的Triton編程語(yǔ)言高效編寫(xiě)GPU代碼,Triton的底層可調(diào)用CUDA,也可調(diào)用其他GPU語(yǔ)言,包括AMD的rocm以及國(guó)產(chǎn)算力芯片語(yǔ)言,如寒武紀(jì)的思元590芯片和海光信息的深算一號(hào)(DCU)內(nèi)置的HYGON ISA指令集。LLM的訓(xùn)練短期內(nèi)雖未完全脫離CUDA 生態(tài),但DeepSeek NSA的推出使其初步呈現(xiàn)出與CUDA解耦的趨勢(shì),并為后續(xù)適配更多類型的算力芯片奠定基礎(chǔ)。以異騰為代表的國(guó)產(chǎn)算力已經(jīng)很好的適配了DeepSeek-R1 等國(guó)產(chǎn)模型,并取得了高效推理的效果,華泰證券認(rèn)為,伴隨海外算力的受限,針對(duì)國(guó)產(chǎn)算力的優(yōu)化或?qū)⒂谐掷m(xù)進(jìn)展,值得重視。

責(zé)任編輯: 賴小風(fēng)
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無(wú)評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換