DeepSeek發布新版R1 稱能力接近美國頂尖模型

日期: 2025-05-29 | 來源: 聯合早報網 | 有0人參與評論 | 字體: 小中大
中國人工智能起步公司深度求索（DeepSeek）發布其熱門推理模型R1的首次更新版本，稱新版R1模型深度思考能力得到強化，整體表現上已接近美國競爭對手OpenAI和谷歌推出的頂尖模型。

DeepSeek星期四（5月29日）晚在官方微信公眾號發文稱，DeepSeek R1模型已完成小版本升級，當前版本為DeepSeek-R1-0528。

文章稱，DeepSeek-R1-0528仍然使用去年12月所發布的DeepSeek V3 Base模型作為基座，但在後訓練過程中投入了更多算力，顯著提升了模型的思維深度與推理能力。相較於舊版R1，新版模型在復雜推理任務中的表現有了顯著提升。

文章特別提到，更新後的R1模型對“幻覺”問題（錯誤或誤導性輸出）進行了優化，在改寫潤色、總結摘要、閱讀理解等場景中，幻覺率降低了45%至50%左右。其他方面的提升則包括更貼近人類偏好的創意寫作，和更好的前端代碼生成、角色扮演能力。

DeepSeek表示，更新後的R1模型在數學、編程與通用邏輯等多個基准測評中，取得當前中國“所有模型中首屈一指的成績”，在整體表現上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美國頂尖模型。

DeepSeek同時也說，該公司在蒸餾DeepSeek-R1-0528的思維鏈後，訓練中國科技巨頭阿裡巴巴的Qwen3-8B基礎模型，得到了DeepSeek-R1-0528-Qwen3-8B，在性能上比原版模型高出10%。

DeepSeek稱：“我們相信，DeepSeek-R1-0528 的思維鏈對於學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義。”

DeepSeek也將繼續開源新版R1模型，允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

另據路透社報道，今年1月發布的R1在全球引發熱議，導致中國以外的科技股暴跌，挑戰了“擴展人工智能需要巨大算力和投資”這一觀點。阿裡巴巴和騰訊等中國科技巨頭此後紛紛發布聲稱超越DeepSeek的模型。

報道稱，DeepSeek的成功也顛覆美國出口管制阻礙中國人工智能進步的看法，因為它以極低成本發布了與美國行業領先模型相當甚至更好的人工智能模型。

為了應對來自DeepSeek的競爭，谷歌的Gemini已推出折扣版本，而OpenAI也降低了價格，並發布對算力要求更低的o3 Mini模型。

DeepSeek曾在3月發布V3大型語言模型的升級版。外界普遍預計DeepSeek將推出R1的後續版本R2，路透社3月曾引述消息人士稱，R2最初計劃在5月發布。
- 新聞來源於其它媒體，內容不代表本站立場！
分類：美國新聞

猜您喜歡

您可能也喜歡

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

視頻

相關功能

加西網新聞