| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

S1成本僅50美元 性能媲美Deepseek-R1

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
在DeepSeek火爆全球之際,一個更低成本的AI推理模型悄然登場...


近日,一項來自斯坦福大學和華盛頓大學等機構的研究成果引起了市場關注,李飛飛等人以不到50美元的雲計算費用成功訓練出了一個名為s1的AI推理模型。研究成果表明,s1在數學和編碼能力測試中與OpenAI的o1和DeepSeek的R1等模型的表現不相上下。

s1論文作者Niklas Muennighoff表示:


“DeepSeek r1令人興奮,但缺少OpenAI的測試時間擴展圖,並且需要大量數據。我們推出了s1,僅使用1K樣本和簡單的測試時間幹預即可重現o1的預覽擴展和性能。”

簡單高效的訓練方法,挑戰傳統AI研發模式

s1的研究團隊表示,s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental為基礎模型,通過蒸餾法提煉出來的。

他們采用了一種名為test-time scaling的方法。研究團隊構建了一個小型數據集s1K,通過難度、多樣性和質量三個標准來篩選,其中包括1000個經過精心挑選的問題以及相應答案,並附上了“推理”過程,僅使用了16台英偉達H100 GPU,耗時26分鍾就完成了訓練。


這種方法與傳統的大規模強化學習方法(RL)形成鮮明對比,後者的成本通常較高,DeepSeek、OpenAI都采用了這種方法。而s1的研究通過較小的數據集和監督微調(SFT)蒸餾推理模型,大大降低了訓練成本並提高了效率。

此外,為了提高答案的准確度,研究團隊還運用了一種“預算強制”技術,可以控制測試時間計算,通過強制提前終止模型的思考過程,或在s1推理時多次追加“等待”指令以延長思考,從而優化性能。

研究顯示,新模型s1-32B在使用該技術後,性能與測試時的計算資源成正相關。


性能媲美頂級模型,引發行業關注和擔憂

根據研究團隊的測試結果可知,在競賽數學問題上,s1-32B的表現較o1-preview高27%(MATH和AIME24);且該模型在AIME24上的表現幾乎與Gemini 2.0 Thinking API相當,顯示其蒸餾過程是有效的。

而s1的出現也引發了行業的擔憂。此前,OpenAI曾指控DeepSeek不當使用其API數據進行蒸餾。

有分析人士質疑,如果任何人都可以輕易復制和超越現有的頂級模型,那麼大型AI公司多年的研發投入和技術積累可能會受到威脅。而且,盡管蒸餾技術在以較低成本復現AI模型方面表現出色,但其對新AI模型性能的提升效果並不顯著。
覺得新聞不錯,請點個贊吧     無評論不新聞,發表一下您的意見吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0303 秒 and 4 DB Queries in 0.0014 秒