DeepSeek低調升級,引發科技圈熱議。
5月28日,DeepSeek 在官(guān)方微信群發布消息稱,DeepSeek R1模型已完(wán)成“小版本試升級”,歡迎前往(wǎng)官方網頁、APP、小程序測試(打開深度思考),API 接口和使用方式保(bǎo)持不變。
不過,澎湃新聞記(jì)者查詢官方網站等(děng),發現沒(méi)有對此次更新的詳(xiáng)細信息。記者谘詢了一位DeepSeek內部人士,對方(fāng)回複稱是“小升級”。
根據Hugging Face,DeepSeek-R1此次開源版本為0528。
從宣傳來看,此次升級十分低調(diào),不過,根據網友測評,此次(cì)升級可不是簡單的“小升級”。
有科技媒體分(fèn)析稱(chēng),時隔4個月,DeepSeek-R1完成了超進化(huà),編碼能力強(qiáng)到離譜,而且思考時間更長(zhǎng)了。據稱,新模型(xíng)基於DeepSeek-V3-0324訓練(參數為660B)。在LiveCodeBench基準(zhǔn)上,DeepSeek-R1-0528性能幾(jǐ)乎與o3-mini(High)和o4-mini(Medium)實力相當,一舉超越了Gemini 2.5 Flash。
科技類網站“AIGC開放社(shè)區”的評論稱,在著名代碼測(cè)試平台Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。也有網友對新版R1的風格進行了測試,幾乎和OpenAI的o3差不多(duō)。
從社交媒體(tǐ)的反饋來看,網友最為關注的(de)是此次DeepSeek R1更新後的思考(kǎo)時間變長。據測評顯示(shì),此次DeepSeek單任(rèn)務處理時長可(kě)達30-60分鍾。
此(cǐ)外(wài),有網友(yǒu)通過實驗對比了(le)Claude-4-Sonnet與DeepSeek-R1-0528的實際表現。可以看到,DeepSeek-R1生(shēng)成的代碼在模擬物理碰撞方麵表現更好。
值得注意的(de)是,此前有傳言稱(chēng),深度求索可能將(jiāng)在5月(yuè)推出下一代AI大模型(xíng)DeepSeek-R2。
有報道稱,DeepSeek-R2大模型將會采用一種更先進的混合專家模型(xíng)(MoE),其結合更加智能的門控網絡層(Gating Network)以優化高負載推理任務的性(xìng)能。
不過,當時有內部(bù)人士向(xiàng)記(jì)者坦言,該(gāi)傳言(yán)真實度不高。從目前的情況分析,DeepSeek或(huò)許將用此次(cì)R1版本的升級,取代R2版本的推出。
盡管網友評(píng)測(cè)得出的結論十分驚喜,但是也有業內人士向記者表示,建議理(lǐ)性客觀看待,也期待更為(wéi)權威的測評結果。
在DeepSeek R1發布(bù)更新(xīn)後,遠(yuǎn)在大洋彼岸的(de)AI巨(jù)頭英偉達(Nasdaq:NVDA)發布截至4月27日的2026財年第一(yī)財季財報,期內實現營收440.62億美元,同比上漲69%,高於市(shì)場預期的432.8億美元;美(měi)國(guó)通用會計準則(GAAP)下淨利(lì)潤187.75億美元,同比上漲26%。在財報電話會上,英偉達CEO黃仁勳再次談到DeepSeek所引發的市場對於(yú)推理模型的關注(zhù),以及推理模型會需要更大的算力支持,這將驅(qū)動推理算力需(xū)求。
(文章(zhāng)來源:澎湃新聞(wén))
《藏(cáng)海傳》數據爆表刷新多項記錄 打(dǎ)破文化壁壘成功出海
懸疑精品劇《搏憶》開機:霍建華黃宗澤闞(kàn)清子首(shǒu)度合作破解迷(mí)局