DeepSeek R2没等来 R1“小升级”发布：思考时间更长效果如何？

2025-06-14 04:39:04 點擊：895

　　DeepSeek低調升級，引發科技圈熱議。

　　5月28日，DeepSeek 在官（guān）方微信群發布消息稱，DeepSeek R1模型已完（wán）成“小版本試升級”，歡迎前往（wǎng）官方網頁、APP、小程序測試（打開深度思考），API 接口和使用方式保（bǎo）持不變。

　　不過，澎湃新聞記（jì）者查詢官方網站等（děng），發現沒（méi）有對此次更新的詳（xiáng）細信息。記者谘詢了一位DeepSeek內部人士，對方（fāng）回複稱是“小升級”。

　　根據Hugging Face，DeepSeek-R1此次開源版本為0528。

　　從宣傳來看，此次升級十分低調（diào），不過，根據網友測評，此次（cì）升級可不是簡單的“小升級”。

　　有科技媒體分（fèn）析稱（chēng），時隔4個月，DeepSeek-R1完成了超進化（huà），編碼能力強（qiáng）到離譜，而且思考時間更長（zhǎng）了。據稱，新模型（xíng）基於DeepSeek-V3-0324訓練（參數為660B）。在LiveCodeBench基準（zhǔn）上，DeepSeek-R1-0528性能幾（jǐ）乎與o3-mini（High）和o4-mini（Medium)實力相當，一舉超越了Gemini 2.5 Flash。

　　科技類網站“AIGC開放社（shè）區”的評論稱，在著名代碼測（cè）試平台Live CodeBench中顯示，其性能可以媲美OpenAI最新的o3模型高版本。也有網友對新版R1的風格進行了測試，幾乎和OpenAI的o3差不多（duō）。

　　從社交媒體（tǐ）的反饋來看，網友最為關注的（de）是此次DeepSeek R1更新後的思考（kǎo）時間變長。據測評顯示（shì），此次DeepSeek單任（rèn）務處理時長可（kě）達30-60分鍾。

　　此（cǐ）外（wài），有網友（yǒu）通過實驗對比了（le）Claude-4-Sonnet與DeepSeek-R1-0528的實際表現。可以看到，DeepSeek-R1生（shēng）成的代碼在模擬物理碰撞方麵表現更好。

　　值得注意的（de）是，此前有傳言稱（chēng），深度求索可能將（jiāng）在5月（yuè）推出下一代AI大模型（xíng）DeepSeek-R2。

　　有報道稱，DeepSeek-R2大模型將會采用一種更先進的混合專家模型（xíng）(MoE)，其結合更加智能的門控網絡層(Gating Network)以優化高負載推理任務的性（xìng）能。

　　不過，當時有內部（bù）人士向（xiàng）記（jì）者坦言，該（gāi）傳言（yán）真實度不高。從目前的情況分析，DeepSeek或（huò）許將用此次（cì）R1版本的升級，取代R2版本的推出。

　　盡管網友評（píng）測（cè）得出的結論十分驚喜，但是也有業內人士向記者表示，建議理（lǐ）性客觀看待，也期待更為（wéi）權威的測評結果。

　　在DeepSeek R1發布（bù）更新（xīn）後，遠（yuǎn）在大洋彼岸的（de）AI巨（jù）頭英偉達（Nasdaq：NVDA）發布截至4月27日的2026財年第一（yī）財季財報，期內實現營收440.62億美元，同比上漲69%，高於市（shì）場預期的432.8億美元；美（měi）國（guó）通用會計準則（GAAP）下淨利（lì）潤187.75億美元，同比上漲26%。在財報電話會上，英偉達CEO黃仁勳再次談到DeepSeek所引發的市場對於（yú）推理模型的關注（zhù），以及推理模型會需要更大的算力支持，這將驅（qū）動推理算力需（xū）求。

（文章（zhāng）來源：澎湃新聞（wén））

《藏（cáng）海傳》數據爆表刷新多項記錄打（dǎ）破文化壁壘成功出海
 懸疑精品劇《搏憶》開機：霍建華黃宗澤闞（kàn）清子首（shǒu）度合作破解迷（mí）局

DeepSeek R2没等来 R1“小升级”发布：思考时间更长 效果如何？

DeepSeek R2没等来 R1“小升级”发布：思考时间更长效果如何？