據(jù)上海證券報,2月6日,記者從多方確認,全球頂尖人工智能科學(xué)家許主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集團副總裁,負責(zé)AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及Agents相關(guān)基礎(chǔ)研究與應(yīng)用解決方案。
另據(jù)了解,阿里AI To C業(yè)務(wù)正在組建頂級AI算法研究和工程團隊,吸引大量業(yè)內(nèi)優(yōu)秀人才加盟。
圖片來源:每日經(jīng)濟新聞 資料圖
公開資料顯示,許主洪教授在人工智能工業(yè)界和學(xué)術(shù)界擁有超20年經(jīng)驗,曾在新加坡南洋理工大學(xué)、新加坡管理大學(xué)擔(dān)任教授。他發(fā)表的300余篇人工智能頂級學(xué)術(shù)論文,引用量超過五萬次。他的多篇“多模態(tài)預(yù)訓(xùn)練”主題論文影響力很大,論文引用數(shù)位列當(dāng)年全球前五,其提出的預(yù)訓(xùn)練策略有效降低成本,深刻影響了全球大模型研發(fā)。
作為全球多模態(tài)大模型領(lǐng)域的領(lǐng)軍人物,他曾擔(dān)任全球最大企業(yè)軟件廠商Salesforce集團副總裁、亞洲研究院創(chuàng)始院長,從0到1搭建了Salesforce亞洲人工智能研究體系,主導(dǎo)多個開創(chuàng)行業(yè)先河的人工智能研究項目和應(yīng)用產(chǎn)品。2023年,許主洪創(chuàng)立人工智能初創(chuàng)公司,開發(fā)出先進的多模態(tài)大語言模型,推出了前沿的圖像和視頻生成模型及產(chǎn)品。
據(jù)內(nèi)部人士透露,許主洪將專注于AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及Agents相關(guān)基礎(chǔ)研究與應(yīng)用解決方案,大幅提升阿里巴巴AI應(yīng)用C端產(chǎn)品在模型結(jié)合應(yīng)用的端對端閉環(huán)能力。有業(yè)內(nèi)人士分析,2025年初,世界級頂尖科學(xué)家的加盟,可以視為阿里AI To C加碼人才與資源投入的重要信號。未來,大模型頂級人才團隊將支撐起阿里AI To C在多模態(tài)Agents等方向的深入探索,也為下一階段構(gòu)建面向用戶的AI應(yīng)用平臺打開了想象空間。
1月29日,阿里云通義千問旗艦版模型Qwen2.5-Max正式升級發(fā)布。
據(jù)微信公眾號“阿里云”消息,Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens。新模型展現(xiàn)出極強勁的綜合性能,在多項公開主流模型評測基準(zhǔn)上錄得高分,全面超越了目前全球領(lǐng)先的開源MoE模型以及最大的開源稠密模型。目前,開發(fā)者可在Qwen Chat平臺免費體驗?zāi)P?,企業(yè)和機構(gòu)也可通過阿里云百煉平臺直接調(diào)用新模型API服務(wù)。
官方資料表示,由于無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團隊將Qwen2.5-Max與目前領(lǐng)先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準(zhǔn)測試中,Qwen2.5-Max全部超越了對比模型。
圖片來源:微信公眾號阿里云
據(jù)中國基金報,阿里通義千問團隊表示,Qwen2.5-Max采用超大規(guī)模MoE(混合專家)架構(gòu),基于超過20萬億token的預(yù)訓(xùn)練數(shù)據(jù)及精心設(shè)計的后訓(xùn)練方案進行訓(xùn)練。
據(jù)介紹,Qwen2.5-Max在知識、編程、全面評估綜合能力以及人類偏好對齊等主流權(quán)威基準(zhǔn)測試上,展現(xiàn)出全球領(lǐng)先的模型性能。指令模型是所有人可直接對話體驗到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準(zhǔn)測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
值得注意的是,除了發(fā)布Qwen2.5-Max以外,1月28日,阿里還開源了全新的視覺理解模型Qwen2.5-VL,推出了3B、7B、72B三個尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項權(quán)威評測中奪得視覺理解冠軍,全面超越GPT-4o與Claude3.5。
截至2月6日發(fā)稿,阿里巴巴-W(HK9988)報97.95港元,漲幅0.41%,市值1.9萬億港元。
校對:姚遠