DeepSeek,繼續(xù)在全球刷屏!
2月1日,#DeepSeek在美商標(biāo)被梁文鋒校友搶注#的話題沖上微博熱搜。據(jù)新華每日電訊援引TC報(bào)道,一家總部位于美國特拉華州的名稱為Delson Group的公司申請了DeepSeek商標(biāo)。報(bào)道稱,Delson Group的首席執(zhí)行官兼創(chuàng)始人名為Willie Lu,后者與DeepSeek創(chuàng)始人梁文鋒畢業(yè)于同一所大學(xué)——浙江大學(xué)。
另外,據(jù)華為云官方公眾號(hào)2月1日消息,DeepSeek-R1開源后引發(fā)全球用戶和開發(fā)者關(guān)注。經(jīng)過硅基流動(dòng)和華為云團(tuán)隊(duì)連日攻堅(jiān),現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。
值得關(guān)注的是,最近幾天,DeepSeek的熱度居高不下。日前,英偉達(dá)、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。此外,或許是迫于DeepSeek帶來的壓力,OpenAI緊急上線新一代推理模型o3-mini,并首次向ChatGPT免費(fèi)用戶開放推理模型。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權(quán)重,并允許商用模型蒸餾,為開發(fā)者提供了二次創(chuàng)新的自由空間。這一策略推動(dòng)中國首次在通用大模型開源領(lǐng)域占據(jù)技術(shù)制高點(diǎn),增強(qiáng)全球AI 話語權(quán)。同時(shí),開源生態(tài)可能加速行業(yè)技術(shù)路線趨同,通用大模型因同質(zhì)化加劇競爭,只有擁有真正領(lǐng)先技術(shù)的企業(yè)才能在這種趨勢中留存。因此,此次國產(chǎn)開源模型的突破有望重塑全球AIGC技術(shù)路線及產(chǎn)業(yè)格局。
在美商標(biāo)被梁文鋒校友搶注
據(jù)新華每日電訊援引TC報(bào)道稱,近日,中國人工智能公司 DeepSeek成為大規(guī)模網(wǎng)絡(luò)攻擊的目標(biāo)。現(xiàn)在,該公司似乎又面臨新的麻煩:美國商標(biāo)糾紛。另一家公司申請了DeepSeek商標(biāo):一家總部位于特拉華州的公司,名稱為Delson Group Inc.
Delson Group 聲稱,它自2020年初以來一直在銷售DeepSeek品牌的 AI 產(chǎn)品。其首席執(zhí)行官兼創(chuàng)始人名為 Willie Lu。Willie Lu與 DeepSeek 創(chuàng)始人梁文鋒畢業(yè)于同一所大學(xué)——浙江大學(xué)。
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù)。
DeepSeek在2024年12月26日推出V3(對標(biāo)GPT4o),因其顯著的性能,用戶迅速開始增長,同時(shí)在1月20日發(fā)布R1(對標(biāo)GPT-o1)后,進(jìn)一步出圈。根據(jù)點(diǎn)點(diǎn)數(shù)據(jù),從DeepSeek在美國下載排名從1月22日的201名,迅速在1月27日登頂?shù)谝幻?;根?jù)七麥數(shù)據(jù),截至1月30日,DeepSeek在168個(gè)國家位居下載榜第一名。
1月24日,著名投資公司A16z的創(chuàng)始人馬克·安德森發(fā)文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動(dòng)性的評價(jià)來自ScaleAI創(chuàng)始人亞歷山大·王(AlexandrWang)。他說:過去十年來,美國可能一直在AI競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。
AI巨頭紛紛接入DeepSeek
1月31日,英偉達(dá)(NVIDIA)宣布,NVIDIA NIM已經(jīng)可以使用DeepSeek-R1。英偉達(dá)官網(wǎng)當(dāng)天發(fā)布文章指出,DeepSeek-R1是具備最先進(jìn)推理能力的開放模型,比起直接提供響應(yīng),像DeepSeek-R1這樣的推理模型,會(huì)對查詢進(jìn)行多次推理處理,使用連鎖思維、共識(shí)和搜尋方法來生成最佳答案。
上述文章寫道,為了幫助開發(fā)者安全地試驗(yàn)這些功能,并構(gòu)建自己的專門代理,DeepSeek-R1模型現(xiàn)已作為NVIDIA NIM微服務(wù)預(yù)覽版上線使用。
報(bào)道稱,DeepSeek先前橫空出世重創(chuàng)美國科技股,一度影響英偉達(dá)股價(jià)重挫17%,引發(fā)討論。英偉達(dá)先前也發(fā)聲,指DeepSeek的進(jìn)步,代表了英偉達(dá)芯片對于內(nèi)地市場的可用性,而未來,DeepSeek會(huì)需要更多英偉達(dá)芯片滿足服務(wù)的需求。
另據(jù)參考消息援引臺(tái)灣東森新聞網(wǎng)報(bào)道,近日,與OpenAI是密切合作伙伴的微軟宣布,目前已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級AI服務(wù)平臺(tái)的一部分。
微軟作為OpenAI的最大股東,長期資助OpenAI之余,還深度整合其AI技術(shù),因此將DeepSeek-R1正式納入的消息曝光后,外界十分關(guān)注微軟為何在OpenAI對DeepSeek進(jìn)行調(diào)查的同時(shí),仍決定將R1模型納入其AI服務(wù)。
微軟強(qiáng)調(diào),DeepSeek-R1模型已通過“嚴(yán)格的紅隊(duì)測試與安全評估”,并經(jīng)歷“模型行為自動(dòng)化檢測與廣泛的安全審查,以降低潛在風(fēng)險(xiǎn)”。
微軟也在聲明中提到,后續(xù)微軟仍會(huì)持續(xù)評估DeepSeek-R1模型,并可能進(jìn)行一定程度的調(diào)整與優(yōu)化,以提升其準(zhǔn)確度及審查機(jī)制。
1月31日,亞馬遜云科技也宣布,客戶現(xiàn)已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客戶還可以通過Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
OpenAI首次向免費(fèi)用戶開放推理模型
DeepSeek的爆火,使得全球在AI領(lǐng)域的競爭進(jìn)一步白熱化。當(dāng)?shù)貢r(shí)間1月31日,OpenAI正式上線競品推理模型o3-mini,并首次向免費(fèi)用戶開放推理模型。
OpenAI介紹稱,o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”分為低、中、高三個(gè)級別。這種靈活性使得o3-mini可以在面對難題時(shí)“更努力思考”,而需要效率時(shí)優(yōu)先考慮回應(yīng)速度。
據(jù)OpenAI披露,在2024年美國數(shù)學(xué)邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng)。在最高努力水平時(shí),o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。在博士級科學(xué)問題(GPQA Diamond)方面,三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%。開發(fā)者可根據(jù)場景需求,靈活選擇低、中、高三級推理強(qiáng)度,使模型在應(yīng)對復(fù)雜挑戰(zhàn)時(shí)能“深度思考”,或在需要快速響應(yīng)時(shí)優(yōu)先保證速度。
ChatGPT Plus、Team及Pro用戶即日(1月31日)可體驗(yàn)o3-mini,企業(yè)用戶將在一周后獲得訪問權(quán)限。即日(1月31日)起,免費(fèi)版用戶也可通過消息編輯器選擇“推理”模式或重新生成回復(fù)來試用o3-mini,這是ChatGPT首次向免費(fèi)用戶開放推理模型。
在OpenAI發(fā)布新模型o3-mini后,麻省理工知名AI研究科學(xué)家、著名科技播客主持人評價(jià)該模型稱,OpenAI的o3-mini是個(gè)不錯(cuò)的模型,DeepSeek的R1性能和它差不多,但價(jià)格更便宜,且能展示推理過程。更好的模型會(huì)不斷出現(xiàn)(很期待o3 Pro 面世),但 “DeepSeek 時(shí)刻” 意義非凡。5年后人們?nèi)詴?huì)銘記這一偉大時(shí)刻,是科技史上的關(guān)鍵節(jié)點(diǎn),部分原因是其地緣政治影響,當(dāng)然還有諸多其他緣由。
機(jī)構(gòu):DeepSeek重構(gòu)大模型生態(tài)
DeepSeek日前發(fā)布其最新開源模型DeepSeek-R1,用較低的成本達(dá)到了接近于OpenAI開發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長期以來“堆算力”的路徑依賴,其影響還波及了資本市場。
從定價(jià)看,DeepSeek-R1不僅開源,API(接口)價(jià)格還明顯低于GPT-o1。DeepSeek-R1輸入(緩存命中)、輸出定價(jià)分別為每百萬tokens 1元、6元,低于GPT-o1的55元、438元,具備性價(jià)比優(yōu)勢。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu),展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說,DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個(gè)數(shù)量級。
國泰君安指出,DeepSeek-R1以開源、高性能及低成本API對標(biāo)OpenAI o1。其蒸餾模型的優(yōu)異表現(xiàn)將支持消費(fèi)電子、智能駕駛等終端AI的部署,開源策略將重整通用模型競爭格局,大模型的商業(yè)化落地將在DeepSeek 的低價(jià)API支持下加速,未來垂類應(yīng)用也有望加速創(chuàng)新迭代。該券商表示,R1在后訓(xùn)練階段通過大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),在極少標(biāo)注數(shù)據(jù)下提升推理能力,驗(yàn)證了算法優(yōu)化的高效性。這一技術(shù)突破打破了海外企業(yè)在復(fù)雜任務(wù)上的技術(shù)壟斷,為中國大模型技術(shù)參與全球競爭提供了實(shí)證支撐。
長江證券也表示,國產(chǎn)模型推理能力對齊業(yè)界領(lǐng)先水平,看好推理算力與應(yīng)用側(cè)受益。一方面,國產(chǎn)推理模型持續(xù)迭代,推理側(cè)的scaling up將帶來推理算力需求的顯著提升;另一方面,通過利用DeepSeek-R1整理的80萬個(gè)樣本進(jìn)行微調(diào),小型模型推理能力顯著提升,或加速垂類模型應(yīng)用落地進(jìn)程。