| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

國產AI高考708分,這款模型靠什麼成為「屏蔽生」?


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
這兩天,各地高考陸續放榜,大模型「陪考」成績單也新鮮出爐。


高考結束後,多家媒體對國內外主流大模型進行橫向測試,有全科綜合,有單科專項,多維度交叉比拼。

先看綜合成績。羊城晚報教育發展研究院拉來 8 位 AI 考生全科作答,由 2 名資深教師獨立盲評,總分按歷史類和物理類分科方式統計。


結果顯示,物理類總分上,Claude Opus 4.8 與訊飛星火X2 以 708 分並列第一;歷史類總分突破 700 分的,則只有訊飛星火X2,兩類均達到廣東屏蔽生水平。



從總分維度看,頭部模型之間的得分差距並不懸殊,最終排名更多取決於全科表現的穩定性。

ChatGPT 5.5 Pro 和 Claude Opus 4.8 在長文本輸出和議論文論述上均無明顯短板,但在歷史類總分上未能躋身前兩位,說明均衡表現本身也有層級差異。


訊飛星火X2 在兩類總分中均取得領先,評測報告給出的解釋是,其優勢來自語言理解、數理推理和綜合分析等不同任務之間的相對均衡,沒有單一科目形成明顯拉動。

再看單科專項。

新京報選取 2026 年新高考 I 卷數學題,對 6 款推理型大模型進行專項測試,訊飛星火以 148 分居首,Kimi 145 分、DeepSeek144 分、智譜 143 分、MiniMax 142 分、ChatGPT 137 分依次排列。




澎湃新聞則是組織 9 款大模型寫上海卷高考作文,經兩位教師獨立盲評取平均分。星火 65.5 分居首,Gemini 64.5 分、豆包 64 分緊隨其後。



英文作文這邊,《觀察者網》測了 12 款大模型,訊飛星火和 ChatGPT 5.5 Pro 並列進入第一梯隊。
覺得新聞不錯,請點個贊吧     這條新聞還沒有人評論喔,等著您的高見呢
上一頁123下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
      大家正在圍觀
    瞞不住了!38歲劉亦菲高調官宣喜訊
    Costco7月新品曝光!這些爆款熱賣
    尹大衛訪華提前返程 加國有大動作
    急診苦等10小時 大溫女子出門倒地
    快沖!溫村世界杯淘汰賽門票價暴跌
    加國詭異挑戰爆紅 警方集體發警告
    無處安息 列治文終於擬建紀念花園
    BC這個網紅公園關閉 律師指或違憲
    人才流失加劇 溫村的底氣還剩多少
    嚇人!加國女子遛狗被灰熊一路逼近
      同類熱門新聞
    誰拿第一?全球智商排名來了,中美
    並非找不到工作!今年畢業最殘酷的
    黃石驚魂!野牛頂傷12歲兒童送醫
    哈工大錄取通知書,回歸"薄薄的一
    職高女生胸口紋蝴蝶引全網圍攻,美
    國產AI高考708分,這款模型靠什麼
    "我的電影黨課"《四渡》專場舉辦:
    692、668、644,三胞胎兄弟高考分
    馬雲低調現身哈佛、MIT校園 被贊
    讓機器人鑽進血管治病 夢想成真
      隨時閱讀新聞

    加西網微信

    大溫優惠小紅書

    溫哥華地產中心微信

    Android: 加西網
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0428 秒 and 5 DB Queries in 0.0086 秒