| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

GPT-5.2降智遭全網差評!奧特曼慌了


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
年終AI大戲,OpenAI敗給了谷歌?GPT-5.2上線48小時,全網吐槽一大片。第三方數據實證,Gemini 3 Pro才是真正的王者。


OpenAI打出了GPT-5.2這張“年度王牌”,卻沒有打贏谷歌...

Epoch AI最新報告,GPT-5.2的能力指數(ECI)得分152,僅次於Gemini 3 Pro。


在多項基准測試中,GPT-5.2的實力並沒有“全線霸榜”。

在由陶哲軒聯手百位數學家出的考題——FrontierMath中,GPT-5.2僅在T1-3級中霸榜,T4還是Gemini 3的高地。

另外,在國際象棋Chess Puzzles中,GPT-5.2拿下了第一的成績。

唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味著迭代後的可信度更差了。

不僅如此,多個第三方基准評測顯示,GPT-5.2遠不及預期,沒有打敗Gemini 3。

包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之後。

發布僅兩天,GPT-5.2水花不大,反而圈子裡開發者吐槽的不少。

為了打贏這場硬仗,OpenAI拉響“紅色警報”,把改進ChatGPT事項提到了優先級。

更極端的是,內部直接停掉了AGI的研發,Sora也暫停了八周,顯然擺出了破釜沉舟的姿態。



可是呢,在業界來看,OpenAI至今仍未擺脫被動的局面。

GPT-5重度用戶站出來發聲,“GPT-5.2距離成為一塊石頭也不遠了”。

年終之戰,OpenAI敗了?

三年前,谷歌因錯失先機,被OpenAI ChatGPT搶盡了風頭。


昨天,谷歌創始人謝爾蓋·布林重返斯坦福演講,現場公開承認曾經的“最大失誤”:

我們搞砸了——太怕AI說錯話,結果輸掉一個時代。

如今,憑借Gemini 3 Pro+Nano Banana Pro,谷歌已重回AI浪潮之巔。

風水輪流轉。這一次,輪到了OpenAI,卻在2025年這場關鍵戰役中自亂陣腳。

上線首日,奧特曼激動宣稱,API調用量就超過了萬億token,且增長速度極快


此前Information爆料,GPT-5.2,代號大蒜(Garlic),原計劃在明年初亮相。

整個硅谷,曾透露了一種風聲——OpenAI預訓練終結了,甚至GPT-5.1可能基於4o後訓練而來,由此提升不大。

確實如此,在預訓練上,OpenAI遇到了Scaling瓶頸。

預訓練Scaling,或許不大

在GPT-5.2(大蒜)研發上,原爆料稱,OpenAI解決了預訓練環節遇到的一些關鍵問題——

改進之前“最好的”且“體量大得多”的預訓練模型。

在內部,OpenAI整合了在開發“Shallotpeat”期間修復的Bug,積累了許多預訓練的經驗。

正如Information所言,最關鍵的突破發生在“預訓練階段”。

但以上的一切信息,都是新聞報道。OpenAI究竟在預訓練上,是否實現了重大突破,難以得知。

但從官方全線擊敗Gemini 3基准上可以猜測,GPT-5.2在預訓練方面取得了一定的改進。

但是從第三方評測和網友反饋中,GPT-5.2在底層技術迭代上,沒有實現突破式的進展。Epoch AI另一項評估中,頂尖AI大模型在長程任務的性能,Gemini 3依舊是最強的——
不錯的新聞,我要點贊     好新聞沒人評論怎麼行,我來說幾句
上一頁1234...8下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0323 秒 and 5 DB Queries in 0.0023 秒