-
日期: 2025-05-29 | 來源: 聯合早報網 | 有0人參與評論 | 字體: 小 中 大
DeepSeek星期四(5月29日)晚在官方微信公眾號發文稱,DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。
文章稱,DeepSeek-R1-0528仍然使用去年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。相較於舊版R1,新版模型在復雜推理任務中的表現有了顯著提升。
文章特別提到,更新後的R1模型對“幻覺”問題(錯誤或誤導性輸出)進行了優化,在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45%至50%左右。其他方面的提升則包括更貼近人類偏好的創意寫作,和更好的前端代碼生成、角色扮演能力。
DeepSeek表示,更新後的R1模型在數學、編程與通用邏輯等多個基准測評中,取得當前中國“所有模型中首屈一指的成績”,在整體表現上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美國頂尖模型。
DeepSeek同時也說,該公司在蒸餾DeepSeek-R1-0528的思維鏈後,訓練中國科技巨頭阿裡巴巴的Qwen3-8B基礎模型,得到了DeepSeek-R1-0528-Qwen3-8B,在性能上比原版模型高出10%。
DeepSeek稱:“我們相信,DeepSeek-R1-0528 的思維鏈對於學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義。”
DeepSeek也將繼續開源新版R1模型,允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
另據路透社報道,今年1月發布的R1在全球引發熱議,導致中國以外的科技股暴跌,挑戰了“擴展人工智能需要巨大算力和投資”這一觀點。阿裡巴巴和騰訊等中國科技巨頭此後紛紛發布聲稱超越DeepSeek的模型。
報道稱,DeepSeek的成功也顛覆美國出口管制阻礙中國人工智能進步的看法,因為它以極低成本發布了與美國行業領先模型相當甚至更好的人工智能模型。
為了應對來自DeepSeek的競爭,谷歌的Gemini已推出折扣版本,而OpenAI也降低了價格,並發布對算力要求更低的o3 Mini模型。
DeepSeek曾在3月發布V3大型語言模型的升級版。外界普遍預計DeepSeek將推出R1的後續版本R2,路透社3月曾引述消息人士稱,R2最初計劃在5月發布。- 新聞來源於其它媒體,內容不代表本站立場!
- DeepSeek的能力,到底從哪裡來?(圖
- 在加州伯克利才讀完大一 我對頂尖名校濾鏡碎了
- 正妹高中畢業舞會衣著太開放 遭校長告誡
- 加國大行要求員工一周4天回去上班
-
- 溫哥華資深地產經紀 工作誠信認真
- 被性侵後 她殺罪犯 罪犯家人要殺她 亂套了
- 受傷的馬斯卡出現在白宮: 他打的
- 習已嗅到背叛的氣息 網傳中央辦公廳知情人文章
- 新《還珠》開機!瓊瑤兒媳操刀,女主顏值碾壓原版,男主一言難盡
- 曼省因野火肆虐宣布進入緊急狀態
-
- 政局松動信號 任志強獄中獲高規格探視
- 大溫房市緩慢 不少經紀拒絕掛牌
- HBO的《哈利·波特》系列劇集找到了三位年輕主角
- 供應鏈轉移出中國有多快?被這個數據嚇到了
- 查航班狀態 這短缺導致航班延誤增加
- 退薪潮蔓延 傳廣東下令退回"多發退休金"
-
- 突發!美國暫停新的學生簽證面試
- 長槍短炮圍觀 溫哥華新晉羽毛網紅
- 加拿大前總理特魯多之子出道:想和Drake合作
- 比亞迪瘋狂降價逾3成 中國電動車股價一瀉千裡
- 溫哥華資深貸款專家 解決貸款需求
- 報告:加國各省政府阻礙了住房建設
-
目前還沒有人發表評論, 大家都在期待您的高見