欢迎您游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

故事 | 移民 | 留学 | 八卦 | 娱乐 | 投资 | 旅游
就业 | 健康 | 文艺 | 情感 | 科技 | 华人 | 海归

温西 | 西温 | 本那比 | 列治文 | 白石 | 市中心
温东 | 北温 | 高贵林 | 北素里 | 素里 | 满地宝

大温 | 玩乐 | 吃喝 | 社团 | 汽车 | 贴图
生活 | 房屋 | 亲子 | 摄影 | 原创 | 投资

专栏 | 视频
群组 | 图库

生活资讯专栏科技信息

2025年AI看不懂时钟!90%人答对顶尖AI全军覆没

2025-09-08 | 来源: 新智元 | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

只要表盘包含上述信息，就要求LLM一并输出。

2. 时间的加减

该任务要求LLM对给定时间进行加减，得到新时间。

3. 旋转时钟指针

这个任务是关于操作时钟的指针。该任务要求模型选择时/分/秒针，并按指定角度顺时针或逆时针旋转。

4. 时区转换

这个任务是关于不同地方的时间。比如，给定纽约的夏令时，模型需推算不同地点的当地时间。

结果出乎意料

结果有哪些出乎意料的发现？

模型与人类不仅正确率差距巨大，错误模式也截然不同：

李自成惨败山海关 10万精锐全军覆没犯致命错误

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?

马云站台的盒马,为何会员店全军覆没?

人类误差中位数仅3分钟，最佳模型却高达1小时较弱模型的误差约3小时，结合12小时制表盘循环特性，相当于随机噪声

另一个有趣发现是，某些钟表特征的读取难度存在显着差异：

在读取非常见的复杂钟表及高精度要求场景时，模型表现最差罗马数字与环形数字的朝向最难识别，其次是秒针、杂乱背景和镜像时钟

除了读时，其他问题对模型而言反而更简单：

表现最佳的模型能高精度回答时间加减、指针旋转角度或时区转换问题，部分场景准确率可达100%

在不同模型的表现对比中，总体趋势是：规模更大的推理型模型普遍优于规模较小或非推理型模型。

点个赞吧！您的鼓励让我们进步

无评论不新闻，发表一下您的意见吧

分享:

上一页 1 234 下一页

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

猜您喜欢:

《亮剑》为什么观摩团全军覆没后,山本就放弃进攻八路军总部了?

中国乒乓球惨败 9人出局男单几乎全军覆没

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?

李自成惨败山海关 10万精锐全军覆没犯致命错误

英国夫妇买下法国村庄修复到破产

加国超市差价惊人 Costco最划算?

大温著名发廊美发师都来自于日本

悲剧维多利亚附近溺亡者尸体找到

93阅兵结束5天,让人担心的事还是发生了,王雷无辜,唐国强最冤

干旱影响秋色加国的枫叶红或打折

周六办非常适合家庭免费户外节日

租金连续11个月下跌哪儿跌幅最大

BC全省都灰了看大温雨水啥时驾到

走路也能治背痛?姿势走路网上走红

24岁北电校花酒后昏迷醒来后容貌大变

温哥华贷款经纪解决各类疑难贷款

您可能也喜欢:

振龙电器各类热销家电种类齐全

无论多久! BC3.4万公务员罢工升级

美中谈判前中国黑客冒充美议员刺探消息

重磅!加拿大推6项新政延长EI福利

中国严峻现实:一场崩盘危机要来了

温哥华房市面临的好消息和坏消息

短短数月,华府"反中鹰派大将"变了

加国这荣登2026年世界顶级旅游地

泽连斯基拒绝普京莫斯科会谈提议:他可以来基辅

"非升即走"!海归博士最悲惨的结局

哈里宁弃妻儿返英英媒曝梅根"死亡禁令"犹似戴妃

阿玛尼去世!内娱10位明星哀悼评论区乱套了

刘建超下落不明,传他代理中联部部长

力邦艺术港展览活动拍摄场地租赁

惊心动魄:中国经济正从头部腐烂

现场画面:羁押1年多后,柯文哲重获自由

我来说两句:

大家正在围观

BC警方抓626名酒驾司机这儿最多

在香港转机可参加三种免费观光游

李连杰的前妻黄秋燕:2005年再婚,

辛芷蕾刚拿国际影后 3位演员摊上

2025下半年4部重磅大剧来袭,杨紫

自助麻辣烫火遍大温列市再开新店

24小时5个瓜!顶流赌博,网红骗婚,

惨烈无比 BC高速迎头相撞两女惨死

亚马逊温哥华招聘年薪高达35.7万

最新榜单揭晓加国人最喜欢去这里

同类热门新闻

iPhone17登场加国定价本周五开抢

特斯拉餐厅开幕挤爆 2周后乱象丛

苹果全新iPhoneAir发布: 史上最薄

香港公司爱上买币:马云持股公司花

苹果发布会10大看点抢先看:除了史

iPhone 17来了,但智能机未来可能

批印度,纳瓦罗为何杠上马斯克?(图

图表盘点:苹果iPhone 17买哪款?最

8.5万亿!特斯拉董事会向马斯克抛

马云花3.1亿买以太坊背后:香港上

随时阅读新闻

加西网微信	大温优惠小红书
温哥华地产中心微信	Android: 加西网

Terms & Conditions

Activities Agreement

加西网为北美中文网传媒集团旗下网站

页面生成: 0.0302 秒 and 5 DB Queries in 0.0013 秒