欢迎您游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

故事 | 移民 | 留学 | 八卦 | 娱乐 | 投资 | 旅游
就业 | 健康 | 文艺 | 情感 | 科技 | 华人 | 海归

温西 | 西温 | 本那比 | 列治文 | 白石 | 市中心
温东 | 北温 | 高贵林 | 北素里 | 素里 | 满地宝

大温 | 玩乐 | 吃喝 | 社团 | 汽车 | 贴图
生活 | 房屋 | 亲子 | 摄影 | 原创 | 投资

专栏 | 视频
群组 | 图库

生活资讯专栏科技信息

2025年AI看不懂时钟!90%人答对顶尖AI全军覆没

2025-09-08 | 来源: 新智元 | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

90%人都会的读钟题，顶尖AI全军覆没！

AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench，专注于测试AI的「看懂」模拟时钟的能力。

结果让人吃惊：

人类平均准确率89.1%，而参与测试的11个主流大模型最好的成绩仅13.3%。

就难度而言，这与「AGI终极测试」ARC-AGI-2相当，比「人类终极考试」更难。

ClockBench共包含180个时钟、720道问题，展示了当前前沿大语言模型（LLM）的局限性。

中国乒乓球惨败 9人出局男单几乎全军覆没

李自成惨败山海关 10万精锐全军覆没犯致命错误

顶尖AI全军覆没!2025年AI看不懂时钟

论文链接：https://clockbench.ai/ClockBench.pdf

虽然这些模型在多项基准上展现出惊人的推理、数学与视觉理解能力，但这些能力尚未有效迁移到「读表」。可能原因：

训练数据未覆盖足够可记忆的时钟特征与时间组合，模型不得不通过推理去建立指针、刻度与读数之间的映射。

时钟的视觉结构难以完整映射到文本空间，导致基于文本的推理受限。

也有好消息：表现最好的模型已展现出一定的视觉推理（虽有限）。其读时准确率与中位误差均显着优于随机水平。

接下来需要更多研究，以判定这些能力能否通过扩大现有范式（数据、模型规模、计算/推理预算）来获得，还是必须采用全新的方法。

ClockBench如何拷打AI？

在过去的几年里，大语言模型（LLM）在多个领域都取得了显着进展，前沿模型很快在许多流行基准上达到了「饱和」。

不错的新闻，我要点赞

无评论不新闻，发表一下您的意见吧

分享:

上一页12 3 4 下一页

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

猜您喜欢:

《亮剑》为什么观摩团全军覆没后,山本就放弃进攻八路军总部了?

中国乒乓球惨败 9人出局男单几乎全军覆没

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?

李自成惨败山海关 10万精锐全军覆没犯致命错误

加拿大人不去美国选择去这些地方

大温山火烟霾危机未来数日恐加剧

惊曝:AI让医生废功癌症检出率崩盘

西捷客机圣马丁降落时发动机着地

5千万乐透又有主!大温有人中100万

温哥华资深地产经纪工作诚信认真

大温著名发廊美发师都来自于日本

别去大温这公园游客受惊四散奔逃

中老年女人穿裙子时要懂这4不要看江珊就知道了

具俊晔在大S墓前修照片,大S去世半年仍走不出阴影

太戏剧!房子刚烧没加男就赢来新家

800元租20年被驱逐大温老妇胜诉

您可能也喜欢:

金正恩到了但川普没来　93阅兵精心计算

中国转向澳洲? 加拿大总理急寻解决方案

前省长:20年后加拿大会感谢特朗普

裁决影响BC所有屋主大温这市上诉

差点被骗!加国CRA+中国公安局电话诈骗全过程

哈里宁弃妻儿返英英媒曝梅根"死亡禁令"犹似戴妃

金正恩邀请白俄罗斯总统卢卡申科访问朝鲜

全面禁止这类人入境美国!中国怒了

网炫加国社区持枪乱射一男子被捕

传加国要推迟电动汽车强制销售令

德国总理:普京或许是我们这个时代最严重的战犯

九三大阅兵,其实是"反美大联盟"?

温哥华贷款经纪解决各类疑难贷款

温哥华汇款/外币兑换汇率最优安全

BC政府工人罢工素里ICBC服务中断

美媒:80年后,亚洲仍难愈日本暴行之创伤

我来说两句:

大家正在围观

美国男子坐冤狱27年真凶竟是关键

女星爆淫狼恶行控奸完想做回朋友

令人意外!张又侠竟重提"人民战争"

可怕!加国难民绑架和性侵华裔女子

曝辛芷蕾翟天临分手原因,无缝衔接

回加国梦想难实现高薪夫妇陷困境

章子怡新烫了卷发美得像换了个人

86岁钢琴家刘诗昆:女儿5岁儿子2岁

北美最不起眼的地下室里,挤满中国

黑垃圾袋戳破啦啦队女神完美人设

同类热门新闻

iPhone17全系价格出炉,有2款要涨

iPhone17即将发布,这操作把全体果

批印度,纳瓦罗为何杠上马斯克?(图

马斯克:特斯拉AI5芯片将成"史诗级

8.5万亿!特斯拉董事会向马斯克抛

股东:只要马斯克达标就让他成为

马云花3.1亿买以太坊背后:香港上

万亿美元天价薪酬内幕炸开彭博曝

辛巴发文回应被带走调查；辛芷蕾

扎克伯格被川普当面讨钱吓到结

随时阅读新闻

加西网微信	大温优惠小红书
温哥华地产中心微信	Android: 加西网

Terms & Conditions

Activities Agreement

加西网为北美中文网传媒集团旗下网站

页面生成: 0.0318 秒 and 5 DB Queries in 0.0019 秒