國產(chǎn)大模型,密集放大招。
2月12日,字節(jié)跳動豆包大模型團(tuán)隊(duì)發(fā)布消息稱,團(tuán)隊(duì)提出了全新的稀疏模型架構(gòu)UltraMem,可有效解決MoE(Mixtureof Experts,混合專家模型)推理時(shí)高額的訪存問題,推理速度較MoE架構(gòu)提升2—6倍,推理成本最高可降低83%。
除了字節(jié)豆包以外,阿里和智譜AI也傳來新動態(tài)。據(jù)TheInformation援引知情人士消息稱,蘋果和阿里將合作為中國iPhone用戶開發(fā)AI功能。受該消息影響,阿里美股直線拉升,一度漲超3%。另外,三星則宣布智譜的AgenticGLM成為其新手機(jī)GalaxyS25的AI能力來源。業(yè)內(nèi)分析稱,蘋果牽手阿里,三星與智譜合作,AI手機(jī)在中國市場的端側(cè)AI大戰(zhàn),將在2025年進(jìn)入焦灼的“貼身肉搏”狀態(tài)。
豆包提出新架構(gòu),大幅降低推理成本
據(jù)豆包大模型團(tuán)隊(duì),在大模型主流的Transformer架構(gòu)下,模型的性能與其參數(shù)數(shù)量和計(jì)算復(fù)雜度呈對數(shù)關(guān)系。隨著大語言模型規(guī)模不斷增大,推理成本會急劇增加,速度變慢。盡管MoE架構(gòu)已經(jīng)成功將計(jì)算和參數(shù)解耦,但在推理時(shí),較小的batchsize就會激活全部專家,導(dǎo)致訪存急劇上升,進(jìn)而使推理延遲大幅增加。
為解決這一問題,字節(jié)跳動豆包大模型Foundation團(tuán)隊(duì)提出了全新的稀疏模型架構(gòu)UltraMem,這一架構(gòu)同樣將計(jì)算和參數(shù)解耦,但在保證模型效果的前提下解決了推理的訪存問題。
實(shí)驗(yàn)結(jié)果表明,在參數(shù)和激活條件相同的情況下,UltraMem在模型效果上超越了MoE,并將推理速度提升了2—6倍。在常見batchsize規(guī)模下,UltraMem的訪存成本幾乎與同計(jì)算量的稠密模型相當(dāng)。
據(jù)了解,最近大火的國產(chǎn)模型團(tuán)隊(duì)DeepSeek,重要的一項(xiàng)技術(shù)基石就是MoE。其自研的DeepSeekMoE是一種創(chuàng)新的大規(guī)模語言模型架構(gòu),通過整合專家混合系統(tǒng)、改進(jìn)的注意力機(jī)制和優(yōu)化的歸一化策略,在模型效率與計(jì)算能力之間實(shí)現(xiàn)了新的平衡。
隨著豆包大模型團(tuán)隊(duì)提出新的稀疏模型架構(gòu)UltraMem,大模型訓(xùn)練推理成本有望進(jìn)一步快速下降,推動大模型的發(fā)展。
AI手機(jī)兩大重磅,都與國產(chǎn)大模型有關(guān)
據(jù)TheInformation援引知情人士消息稱,蘋果和阿里將合作為中國iPhone用戶開發(fā)AI功能,具體功能包括圖像生成、文本優(yōu)化、智能搜索等,以增強(qiáng)iPhone在攝影、通知管理和文本處理等場景的體驗(yàn)。受該消息影響,阿里美股直線拉升,一度漲超3%。
該報(bào)道還稱,蘋果和阿里已將雙方共同開發(fā)的AI功能提交給監(jiān)管機(jī)構(gòu)審批,若獲批,中國將成為全球首個(gè)使用蘋果與本土企業(yè)合作AI功能的地區(qū)。事實(shí)上,此前屢屢有關(guān)于蘋果與國產(chǎn)AI大模型合作的消息傳出,曾有消息稱百度或成為蘋果的合作伙伴,還有傳言稱蘋果曾與騰訊、字節(jié)以及智譜AI、百川等公司接觸。
蘋果在華銷售額已連續(xù)兩年下降,2024年第四季度同比下滑11%,這一舉措是蘋果應(yīng)對中國市場銷售下滑的戰(zhàn)略之一,旨在通過更具吸引力的軟件功能,與華為、vivo等本土品牌的競爭對手抗衡。
阿里是國產(chǎn)AI大模型的第一梯隊(duì)玩家。在今年春節(jié)期間,阿里云通義千問旗艦版模型Qwen2.5-Max正式升級發(fā)布。據(jù)其介紹,Qwen2.5-Max模型是阿里云通義團(tuán)隊(duì)對MoE模型的最新探索成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,展現(xiàn)出極強(qiáng)勁的綜合性能,在多項(xiàng)公開主流模型評測基準(zhǔn)上錄得高分,全面超越了目前全球領(lǐng)先的開源MoE模型以及最大的開源稠密模型。
Qwen2.5-Max的發(fā)布還引發(fā)了資本市場關(guān)于重估中國AI資產(chǎn)的討論。業(yè)內(nèi)人士分析,阿里云不僅發(fā)布了與全球頂尖模型比肩甚至更優(yōu)的模型,而且具備完整的云生態(tài),或能形成類似去年北美云計(jì)算服務(wù)商的投資邏輯。自1月中旬以來,阿里美股累計(jì)漲幅已超30%。
除了蘋果+阿里的組合以外,三星+智譜的合作也引發(fā)市場關(guān)注。智譜和三星基于AgenticGLM展開合作,三星最新手機(jī)GalaxyS25系列現(xiàn)可支持基于AI的實(shí)時(shí)語音和視頻通話,以及實(shí)現(xiàn)視覺理解和系統(tǒng)功能調(diào)用、AI搜索、文案寫作等功能,智譜旗下C端產(chǎn)品智譜清言及清言智能體平臺登陸GalaxyS25系列。
智譜有關(guān)負(fù)責(zé)人介紹稱,AgenticGLM讓GalaxyS25系列能夠同時(shí)處理文本、語音、圖像和視頻等多模態(tài)的數(shù)據(jù),并能夠使用工具,具備自主行動能力。比如,GalaxyS25系列的“語聊視界”功能,能夠讓AI視頻通話功第一次在手機(jī)上同用戶智能互動。GLM-Realtime支持圖片和視頻輸入,能夠精確識別畫面中的文字和細(xì)節(jié),以及流式推理能力帶來了低延時(shí)。它還擁有多輪記憶能力,能作為更聰明的語音助理,為用戶提供流暢的翻譯、搜索等功能。
“基于最新GalaxyAI的三星GalaxyS25系列手機(jī)是三星在全球范圍內(nèi)首次推出具有視頻通話功能的原生AI智能硬件產(chǎn)品。很高興智譜AgenticGLM豐富多樣的AI功能通過系統(tǒng)級的無縫嵌入,能夠?yàn)閺V大用戶提供沉浸、智能、安全的AI手機(jī)體驗(yàn)。”智譜方面表示。
業(yè)內(nèi)人士普遍認(rèn)為,隨著DeepSeek等國產(chǎn)大模型帶動大模型的成本大幅下降,有望推動端側(cè)AI加速發(fā)展,帶動智能手機(jī)、智能家居設(shè)備、智能可穿戴設(shè)備等更多終端設(shè)備集成智能功能。
校對:彭其華