国产99精品,一本色道久久鬼综合88

昨夜，美芯片股暴跌！DeepSeek發(fā)布新模型，白宮也發(fā)聲！

來源：證券時報網(wǎng)作者：周春媚2025-01-28 08:16

AI永不眠。?

由于DeepSeek的R1大語言模型引發(fā)了華爾街對于美國公司模型成本的質(zhì)疑，以及人工智能股票泡沫破裂的恐慌，美股掀起科技股拋售潮。芯片巨頭英偉達當日收盤股價暴跌約16.86%，單日市值蒸發(fā)約6000億美元，博通下跌17.4%，超威半導體公司下跌6.37%，美光科技下跌11.67%，臺積電跌13.23%，微軟下跌2.14%。此外，人工智能領域的衍生品，如電力供應商也受到重創(chuàng)，美國聯(lián)合能源公司股價下跌20.85%，Vistra的股價下跌28.33%。

白宮人工智能和加密貨幣總管David Sacks在X上發(fā)帖稱，DeepSeek R1的表現(xiàn)顯示人工智能競爭將非常激烈，也證明美國總統(tǒng)特朗普廢除拜登行政命令是正確之舉。Sacks說拜登用行政命令束縛了美國的人工智能公司。他還說：“我對美國充滿信心，但我們不能自滿”。

在用R1模型震撼硅谷和暴擊華爾街之后，DeepSeek又在深夜放大招。1月27日晚間10點左右，梁文鋒在社交平臺上X上表示，DeepSeek新版本即將發(fā)布。三個多小時后，人工智能開源社區(qū)HuggingFace就顯示，DeepSeek發(fā)布了參數(shù)大小從10億到70億不等，名為Janus-Pro和JanusFlow的一系列開源多模態(tài)模型。

本次發(fā)布的新模型，重點在于文生圖能力方面。其中，70億參數(shù)的Janus-Pro-7B在GenEval和DPG-Bench基準測試中，以80%和84.2%的準確率測試結(jié)果，擊敗了OpenAI的DALL-E3和StableDiffusion模型等頂尖的圖像生成模型。據(jù)了解，該項目采用MIT許可證開源，開發(fā)者可以通過開源社區(qū)GitHub獲取完整代碼。DeepSeek團隊還表示，Janus-Pro的簡潔設計和卓越性能，使其有望成為下一代統(tǒng)一多模態(tài)模型的重要選擇。

據(jù)DeepSeek發(fā)布的報告介紹，Janus-Pro先進模型是此前發(fā)布的Janus的改進版本。相較于Janus，Janus-Pro包含了優(yōu)化的訓練策略、擴展的訓練數(shù)據(jù)以及擴展到更大的模型規(guī)模。通過這些改進，Janus-Pro在多模態(tài)理解和文本到圖像指令跟隨能力方面取得了顯著進步，同時提升了文本到圖像生成的穩(wěn)定性。

具體來說，Janus-Pro作為一種新穎的自回歸框架，將多模態(tài)理解和生成統(tǒng)一起來，將視覺編碼解耦，以實現(xiàn)多模態(tài)理解和生成。它通過將視覺編碼解耦為單獨的路徑來解決以前方法的局限性，同時仍然使用單一、統(tǒng)一的轉(zhuǎn)換器架構(gòu)進行處理。

值得注意的是，DeepSeek透露，對于1.5B/7B這兩個參數(shù)的模型，整個訓練過程在16/32節(jié)點的集群上進行，每個節(jié)點配備8塊NvidiaA100（40GB）GPU，1.5B/7B模型的訓練時間約為7/14天。也就是說，DeepSeek花了兩周在256塊英偉達A100，就訓練出了擊敗了OpenAI的DALL-E3和StableDiffusion的模型。

DeepSeek還在報告中展示了具體的效果。例如，使用“一條金色的尋回犬安詳?shù)靥稍谀举|(zhì)門廊上，周邊鋪滿了秋天的葉子”和“一個有雀斑的年輕女人戴著一頂草帽，站在一片金色的麥田中”，Janus-Pro-7B都能夠準確捕捉提示中的語義信息，生成合乎邏輯且連貫的圖片。不過，盡管包含大量圖像細節(jié)，Janus-Pro-7B目前僅支持生成分辨率為384×384的圖像。

除此以外，Janus-Pro-7B還具備圖像識別功能。根據(jù)展示的案例，當給Janus-Pro-7B提供一張圖片，并問它“猜猜這是哪里”時，Janus-Pro-7B能夠根據(jù)圖片特點猜測其中展示的是中國杭州的西湖，特別是著名的三潭映月島，并進一步分析稱，“圖片中的建筑是三潭印月的亭子，周邊是平靜的湖水，遠處是連綿的山脈。西湖是中國著名的旅游景點之一，以其美麗的自然景觀和豐富的歷史文化而聞名?！?/p>

事實上，DeepSeek一直在多模態(tài)領域進行探索。去年，DeepSeek就推出了一種基于自回歸的多模態(tài)理解與生成統(tǒng)一模型Janus，將視覺編碼解耦，以實現(xiàn)多模態(tài)理解和生成。進入2025年，公司將Janus進一步升級至Janus-Pro。而在此前接受媒體采訪時，當被問及公司在實現(xiàn)通用人工智能的過程中有哪些坐標，梁文鋒表示DeepSeek押注了三個方向，一是數(shù)學和代碼，二是多模態(tài)，三是自然語言本身。

目前，DeepSeek的C端應用主要聚焦于文本能力，還無法生成圖片或者識別圖像。記者昨天曾讓DeepSeek生成一幅春節(jié)賀歲圖片，但DeepSeek僅給出了圖片創(chuàng)作的色調(diào)、原色等建議，并表示它還無法直接生成圖片，“你可以根據(jù)此描述使用AI繪圖工具如DALL·E、MidJourney等生成”。隨著Janus-Pro的發(fā)布，用戶或許很快也可以使用DeepSeek進行圖像、視頻等領域的創(chuàng)作。