昨夜,美芯片股暴跌!DeepSeek發(fā)布新模型,白宮也發(fā)聲!
來源:證券時報網(wǎng)作者:周春媚2025-01-28 08:16

AI永不眠。?

由于DeepSeek的R1大語言模型引發(fā)了華爾街對于美國公司模型成本的質(zhì)疑,以及人工智能股票泡沫破裂的恐慌,美股掀起科技股拋售潮。芯片巨頭英偉達當日收盤股價暴跌約16.86%,單日市值蒸發(fā)約6000億美元,博通下跌17.4%,超威半導體公司下跌6.37%,美光科技下跌11.67%,臺積電跌13.23%,微軟下跌2.14%。此外,人工智能領域的衍生品,如電力供應商也受到重創(chuàng),美國聯(lián)合能源公司股價下跌20.85%,Vistra的股價下跌28.33%。

白宮人工智能和加密貨幣總管David Sacks在X上發(fā)帖稱,DeepSeek R1的表現(xiàn)顯示人工智能競爭將非常激烈,也證明美國總統(tǒng)特朗普廢除拜登行政命令是正確之舉。Sacks說拜登用行政命令束縛了美國的人工智能公司。他還說:“我對美國充滿信心,但我們不能自滿”。

在用R1模型震撼硅谷和暴擊華爾街之后,DeepSeek又在深夜放大招。1月27日晚間10點左右,梁文鋒在社交平臺上X上表示,DeepSeek新版本即將發(fā)布。三個多小時后,人工智能開源社區(qū)HuggingFace就顯示,DeepSeek發(fā)布了參數(shù)大小從10億到70億不等,名為Janus-Pro和JanusFlow的一系列開源多模態(tài)模型。

本次發(fā)布的新模型,重點在于文生圖能力方面。其中,70億參數(shù)的Janus-Pro-7B在GenEval和DPG-Bench基準測試中,以80%和84.2%的準確率測試結(jié)果,擊敗了OpenAI的DALL-E3和StableDiffusion模型等頂尖的圖像生成模型。據(jù)了解,該項目采用MIT許可證開源,開發(fā)者可以通過開源社區(qū)GitHub獲取完整代碼。DeepSeek團隊還表示,Janus-Pro的簡潔設計和卓越性能,使其有望成為下一代統(tǒng)一多模態(tài)模型的重要選擇。

據(jù)DeepSeek發(fā)布的報告介紹,Janus-Pro先進模型是此前發(fā)布的Janus的改進版本。相較于Janus,Janus-Pro包含了優(yōu)化的訓練策略、擴展的訓練數(shù)據(jù)以及擴展到更大的模型規(guī)模。通過這些改進,Janus-Pro在多模態(tài)理解和文本到圖像指令跟隨能力方面取得了顯著進步,同時提升了文本到圖像生成的穩(wěn)定性。

具體來說,Janus-Pro作為一種新穎的自回歸框架,將多模態(tài)理解和生成統(tǒng)一起來,將視覺編碼解耦,以實現(xiàn)多模態(tài)理解和生成。它通過將視覺編碼解耦為單獨的路徑來解決以前方法的局限性,同時仍然使用單一、統(tǒng)一的轉(zhuǎn)換器架構(gòu)進行處理。

值得注意的是,DeepSeek透露,對于1.5B/7B這兩個參數(shù)的模型,整個訓練過程在16/32節(jié)點的集群上進行,每個節(jié)點配備8塊NvidiaA100(40GB)GPU,1.5B/7B模型的訓練時間約為7/14天。也就是說,DeepSeek花了兩周在256塊英偉達A100,就訓練出了擊敗了OpenAI的DALL-E3和StableDiffusion的模型。

DeepSeek還在報告中展示了具體的效果。例如,使用“一條金色的尋回犬安詳?shù)靥稍谀举|(zhì)門廊上,周邊鋪滿了秋天的葉子”和“一個有雀斑的年輕女人戴著一頂草帽,站在一片金色的麥田中”,Janus-Pro-7B都能夠準確捕捉提示中的語義信息,生成合乎邏輯且連貫的圖片。不過,盡管包含大量圖像細節(jié),Janus-Pro-7B目前僅支持生成分辨率為384×384的圖像。

除此以外,Janus-Pro-7B還具備圖像識別功能。根據(jù)展示的案例,當給Janus-Pro-7B提供一張圖片,并問它“猜猜這是哪里”時,Janus-Pro-7B能夠根據(jù)圖片特點猜測其中展示的是中國杭州的西湖,特別是著名的三潭映月島,并進一步分析稱,“圖片中的建筑是三潭印月的亭子,周邊是平靜的湖水,遠處是連綿的山脈。西湖是中國著名的旅游景點之一,以其美麗的自然景觀和豐富的歷史文化而聞名?!?/p>

事實上,DeepSeek一直在多模態(tài)領域進行探索。去年,DeepSeek就推出了一種基于自回歸的多模態(tài)理解與生成統(tǒng)一模型Janus,將視覺編碼解耦,以實現(xiàn)多模態(tài)理解和生成。進入2025年,公司將Janus進一步升級至Janus-Pro。而在此前接受媒體采訪時,當被問及公司在實現(xiàn)通用人工智能的過程中有哪些坐標,梁文鋒表示DeepSeek押注了三個方向,一是數(shù)學和代碼,二是多模態(tài),三是自然語言本身。

目前,DeepSeek的C端應用主要聚焦于文本能力,還無法生成圖片或者識別圖像。記者昨天曾讓DeepSeek生成一幅春節(jié)賀歲圖片,但DeepSeek僅給出了圖片創(chuàng)作的色調(diào)、原色等建議,并表示它還無法直接生成圖片,“你可以根據(jù)此描述使用AI繪圖工具如DALL·E、MidJourney等生成”。隨著Janus-Pro的發(fā)布,用戶或許很快也可以使用DeepSeek進行圖像、視頻等領域的創(chuàng)作。


校對:陶謙

責任編輯: 闕福生
聲明:證券時報力求信息真實、準確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換