| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

被DeepSeek逼急? OpenAI推新模型 狂卷性價比

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
2月1日報道,今日凌晨,OpenAI發布全新推理模型o3-mini。


OpenAI稱這是其最具成本效益的推理模型,復雜推理和對話能力顯著提升,在科學、數學、編程等領域的性能表現超過前代o1模型,同時保持了o1-mini的低成本和低延遲,並可與聯網搜索功能搭配使用。

o3-mini已在ChatGPT和API中可用,企業版訪問權限將在一周內推出。


顯然DeepSeek登頂美國App Store免費榜給OpenAI制造了壓力。今天,ChatGPT首次向所有用戶免費提供推理模型:用戶可在ChatGPT中選擇“Reason”按鈕來試用o3-mini。

ChatGPT Pro用戶可無限制訪問,Plus和Team用戶的速率限制從原來o1-mini的每天50條消息增加3倍到o3-mini的每天150條消息。

付費用戶還可以選擇更高智能的版本“o3-mini-high”。該版本需要更長的時間才能生成響應。

和o1模型一樣,o3-mini模型的知識截止日期為2023年10月,上下文窗口為20萬個token,最多可輸出10萬個token。

有低(low)、中(medium)、高(high)三個版本的o3-mini,供開發者針對其特定用例進行優化。

o3-mini目前不支持視覺功能,因此開發者仍需使用o1進行視覺推理任務。

即日起,o3-mini在Chat Completions API、Assistants API、Batch API中推出。

OpenAI稱相較推出GPT-4時,每個token的價格已經降低了95%,同時保持了頂級的推理能力。不過o3-mini的API定價還是高於DeepSeek模型。




安全方面,OpenAI發現o3-mini在具有挑戰性的安全性和越獄方面明顯超過GPT-4o。

一、詳解o3-mini:科學數學編程能力進化,延遲明顯降低


OpenAI發布了o3-mini的37頁詳細報告,涵蓋模型的介紹、數據和訓練、測試范圍、安全挑戰和評估、外部紅隊測試、准備框架評估、多語言性能以及結論等多個方面。

o3-mini針對科學、數學、編程推理進行了優化,同時響應速度更快。

該模型在GPQA Diamond(理化生)、AIME 2022-2024(數學)、Codeforces ELO(編程)基准測試中,o3-mini的分數分別為0.77、0.80、2036,比肩或超過o1推理模型。

在14種語言的MMLU測試集上,o3-mini的表現顯著優於o1-mini,展示了其在多語言理解方面的進步。



外部專家測試人員的評估表明,與o1-mini相比,o3-mini的答案更准確、更清晰,推理能力更強。

在人類偏好評估中,測試人員在56%的時間裡更喜歡o3-mini的回答,並觀察到在困難的現實問題上重大錯誤減少了39%。在中推理能力下,o3-mini在一些最具挑戰性的推理和智力評估(包括AIME和GPQA)上的表現與o1相當。
不錯的新聞,我要點贊     已經有 12 人參與評論了, 我也來說幾句吧
上一頁123下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    共有 12 人參與評論    (其它新聞評論)
    評論2 游客 [辛.香.氏.說] 2025-02-01 00:08
    Spending huge amount of money for StarGate plan is to develop their AI tech for monopoly and gorge the users with high prices without competitions. Now DeepSeek joined the competition and beat the AI prices. From this point view, DeepSeek helped all the AI users to save money.
    評論1 游客 [辛.昔.四.篇] 2025-01-31 23:01
    開源,降價。OpenAI居然抄起了DeepSeek的作業。遺憾的是,抄的不夠徹底。請問FBI,要不要發起對OpenAI的國安和資安調查?請問OpenAI,剛剛在白宮宣布4年合資500B成立的Stargate,要不要修改投資計劃,或關門?2周前曾預計,AI大潮退後,即可見誰沒穿內褲,或誰的內褲不見了。沒想到這天來得這麼快,迅雷不及掩耳。只要摒棄壁壘和制裁,科學無遠弗屆。
    上一頁1下一頁
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0357 秒 and 5 DB Queries in 0.0016 秒