| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

国产AI高考708分,这款模型靠什么成为「屏蔽生」?


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
这两天,各地高考陆续放榜,大模型「陪考」成绩单也新鲜出炉。


高考结束后,多家媒体对国内外主流大模型进行横向测试,有全科综合,有单科专项,多维度交叉比拼。

先看综合成绩。羊城晚报教育发展研究院拉来 8 位 AI 考生全科作答,由 2 名资深教师独立盲评,总分按历史类和物理类分科方式统计。


结果显示,物理类总分上,Claude Opus 4.8 与讯飞星火X2 以 708 分并列第一;历史类总分突破 700 分的,则只有讯飞星火X2,两类均达到广东屏蔽生水平。



从总分维度看,头部模型之间的得分差距并不悬殊,最终排名更多取决于全科表现的稳定性。

ChatGPT 5.5 Pro 和 Claude Opus 4.8 在长文本输出和议论文论述上均无明显短板,但在历史类总分上未能跻身前两位,说明均衡表现本身也有层级差异。


讯飞星火X2 在两类总分中均取得领先,评测报告给出的解释是,其优势来自语言理解、数理推理和综合分析等不同任务之间的相对均衡,没有单一科目形成明显拉动。

再看单科专项。

新京报选取 2026 年新高考 I 卷数学题,对 6 款推理型大模型进行专项测试,讯飞星火以 148 分居首,Kimi 145 分、DeepSeek144 分、智谱 143 分、MiniMax 142 分、ChatGPT 137 分依次排列。




澎湃新闻则是组织 9 款大模型写上海卷高考作文,经两位教师独立盲评取平均分。星火 65.5 分居首,Gemini 64.5 分、豆包 64 分紧随其后。



英文作文这边,《观察者网》测了 12 款大模型,讯飞星火和 ChatGPT 5.5 Pro 并列进入第一梯队。
不错的新闻,我要点赞     这条新闻还没有人评论喔,等着您的高见呢
上一页123下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
      大家正在围观
    瞒不住了!38岁刘亦菲高调官宣喜讯
    Costco7月新品曝光!这些爆款热卖
    尹大卫访华提前返程 加国有大动作
    急诊苦等10小时 大温女子出门倒地
    快冲!温村世界杯淘汰赛门票价暴跌
    BC这个网红公园关闭 律师指或违宪
    加国诡异挑战爆红 警方集体发警告
    无处安息 列治文终于拟建纪念花园
    人才流失加剧 温村的底气还剩多少
    吓人!加国女子遛狗被灰熊一路逼近
      同类热门新闻
    谁拿第一?全球智商排名来了,中美
    并非找不到工作!今年毕业最残酷的
    黄石惊魂!野牛顶伤12岁儿童送医
    哈工大录取通知书,回归"薄薄的一
    职高女生胸口纹蝴蝶引全网围攻,美
    国产AI高考708分,这款模型靠什么
    "我的电影党课"《四渡》专场举办:
    692、668、644,三胞胎兄弟高考分
    马云低调现身哈佛、MIT校园 被赞
    让机器人钻进血管治病 梦想成真
      随时阅读新闻

    加西网微信

    大温优惠小红书

    温哥华地产中心微信

    Android: 加西网
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0398 秒 and 5 DB Queries in 0.0095 秒