DeepSeek突傳大動(dòng)作。
2月18日,DeepSeek在社交平臺(tái)X上發(fā)布了一篇關(guān)于NSA的純技術(shù)論文報(bào)告。DeepSeek稱,NSA是一種與硬件高度適配并可原生訓(xùn)練的稀疏注意力機(jī)制,實(shí)現(xiàn)超高速長上下文訓(xùn)練與推理。通過針對(duì)現(xiàn)代硬件的優(yōu)化設(shè)計(jì),NSA加快了推理速度,同時(shí)降低了預(yù)訓(xùn)練成本,而不會(huì)影響性能。
與此同時(shí),人工智能初創(chuàng)公司月之暗面也有大動(dòng)作。2月18日,其宣布推出一款新模型Kimi Latest,它將對(duì)標(biāo)Kimi智能助手當(dāng)前使用的模型,隨智能助手產(chǎn)品更新而同步升級(jí)(模型名稱始終不變),用戶現(xiàn)已可在Kimi開放平臺(tái)體驗(yàn)。
市場(chǎng)層面,2月18日,港股DeepSeek概念股延續(xù)強(qiáng)勢(shì),截至收盤,出門問問大漲超16%,創(chuàng)夢(mèng)天地大漲超12%、美圖公司大漲超10%、快手漲超9%。高盛最新研報(bào)指出,DeepSeek-R1及中國本土AI模型的突破性進(jìn)展,正在重塑科技產(chǎn)業(yè)敘事邏輯。
DeepSeek發(fā)布
2月18日,DeepSeek官方在海外社交平臺(tái)X上發(fā)布了一篇純技術(shù)論文報(bào)告,論文主要內(nèi)容是關(guān)于NSA(Natively Sparse Attention,原生稀疏注意力),官方介紹這是一種用于超快速長文本訓(xùn)練與推理的、硬件對(duì)齊且可原生訓(xùn)練的稀疏注意力機(jī)制,用于超快速的長上下文訓(xùn)練和推理。
校對(duì):趙燕