GPT-5.2降智遭全網差評!奧特曼慌了

2025-12-14 | 來源: 新智元 | 轉到微信 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

年終AI大戲，OpenAI敗給了谷歌？GPT-5.2上線48小時，全網吐槽一大片。第三方數據實證，Gemini 3 Pro才是真正的王者。

OpenAI打出了GPT-5.2這張“年度王牌”，卻沒有打贏谷歌...

Epoch AI最新報告，GPT-5.2的能力指數（ECI）得分152，僅次於Gemini 3 Pro。

在多項基准測試中，GPT-5.2的實力並沒有“全線霸榜”。

在由陶哲軒聯手百位數學家出的考題——FrontierMath中，GPT-5.2僅在T1-3級中霸榜，T4還是Gemini 3的高地。

另外，在國際象棋Chess Puzzles中，GPT-5.2拿下了第一的成績。

唯一例外的是，在SimpleQA Verified上，GPT-5.2都不及GPT-5.1，意味著迭代後的可信度更差了。

不僅如此，多個第三方基准評測顯示，GPT-5.2遠不及預期，沒有打敗Gemini 3。

包括OCR-Arena、simple-bench、Live-Bench上，GPT-5.2甚至都排在了Claude Opus 4.5之後。

發布僅兩天，GPT-5.2水花不大，反而圈子裡開發者吐槽的不少。

為了打贏這場硬仗，OpenAI拉響“紅色警報”，把改進ChatGPT事項提到了優先級。

更極端的是，內部直接停掉了AGI的研發，Sora也暫停了八周，顯然擺出了破釜沉舟的姿態。

可是呢，在業界來看，OpenAI至今仍未擺脫被動的局面。

GPT-5重度用戶站出來發聲，“GPT-5.2距離成為一塊石頭也不遠了”。

年終之戰，OpenAI敗了？

三年前，谷歌因錯失先機，被OpenAI ChatGPT搶盡了風頭。

OpenAI"至暗時刻"已至,谷歌一劍封喉奧特曼

和馬斯克杠上奧特曼想投資火箭公司與SpaceX競爭

1條短信7年恩怨!奧特曼與馬斯克決裂新隱情

昨天，谷歌創始人謝爾蓋·布林重返斯坦福演講，現場公開承認曾經的“最大失誤”：

我們搞砸了——太怕AI說錯話，結果輸掉一個時代。

如今，憑借Gemini 3 Pro+Nano Banana Pro，谷歌已重回AI浪潮之巔。

風水輪流轉。這一次，輪到了OpenAI，卻在2025年這場關鍵戰役中自亂陣腳。

上線首日，奧特曼激動宣稱，API調用量就超過了萬億token，且增長速度極快

此前Information爆料，GPT-5.2，代號大蒜（Garlic），原計劃在明年初亮相。

整個硅谷，曾透露了一種風聲——OpenAI預訓練終結了，甚至GPT-5.1可能基於4o後訓練而來，由此提升不大。

確實如此，在預訓練上，OpenAI遇到了Scaling瓶頸。

預訓練Scaling，或許不大

在GPT-5.2（大蒜）研發上，原爆料稱，OpenAI解決了預訓練環節遇到的一些關鍵問題——

改進之前“最好的”且“體量大得多”的預訓練模型。

在內部，OpenAI整合了在開發“Shallotpeat”期間修復的Bug，積累了許多預訓練的經驗。

正如Information所言，最關鍵的突破發生在“預訓練階段”。

但以上的一切信息，都是新聞報道。OpenAI究竟在預訓練上，是否實現了重大突破，難以得知。

但從官方全線擊敗Gemini 3基准上可以猜測，GPT-5.2在預訓練方面取得了一定的改進。

但是從第三方評測和網友反饋中，GPT-5.2在底層技術迭代上，沒有實現突破式的進展。Epoch AI另一項評估中，頂尖AI大模型在長程任務的性能，Gemini 3依舊是最強的——