欢迎您游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

故事 | 移民 | 留学 | 八卦 | 娱乐 | 投资 | 旅游
就业 | 健康 | 文艺 | 情感 | 科技 | 华人 | 海归

温西 | 西温 | 本那比 | 列治文 | 白石 | 市中心
温东 | 北温 | 高贵林 | 北素里 | 素里 | 满地宝

大温 | 玩乐 | 吃喝 | 社团 | 汽车 | 贴图
生活 | 房屋 | 亲子 | 摄影 | 原创 | 投资

专栏 | 视频
群组 | 图库

生活资讯专栏加国留学

留学生: 中留学生论文登Nature 大模型对人类可靠性降低

2024-10-04 | 来源: 量子位 | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

00后国人一作登上Nature，这篇大模型论文引起热议。

简单来说，论文发现：更大且更遵循指令的大模型也变得更不可靠了，某些情况下 GPT-4在回答可靠性上还不如GPT-3。

与早期模型相比，有更多算力和人类反馈加持的最新模型，在回答可靠性上实际愈加恶化了。

结论一出，立即引来20多万网友围观。

在Reddit论坛也引发围观议论。

这让人不禁想起，一大堆专家/博士级别的模型还不会“9.9和9.11”哪个大这样的简单问题。

关于这个现象，论文提到这也反映出，模型的表现与人类对难度的预期不符。

换句话说，“LLMs在用户预料不到的地方既成功又（更危险地）失败”。

Ilya Sutskever2022年曾预测：

当年的中国留学生成了这国女首富

特朗普:中美协议非常好欢迎中国留学生赴美学习

上月大温公寓起火留学生伤重身亡

也许随着时间的推移，这种差异会减少。

然而这篇论文发现情况并非如此。不止GPT，LLaMA和BLOOM系列，甚至OpenAI新的 o1模型和Claude-3.5-Sonnet也在可靠性方面令人担忧。

更重要的是，论文还发现依靠人类监督来纠正错误的做法也不管用。

有网友认为，虽然较大的模型可能会带来可靠性问题，但它们也提供了前所未有的功能。

我们需要专注于开发稳健的评估方法并提高透明度。

觉得新闻不错，请点个赞吧

无评论不新闻，发表一下您的意见吧

分享:

上一页12 3 4 5 6 下一页

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

猜您喜欢:

泪目!袁隆平墓前非洲留学生带来非洲大米

中国留学生腹痛寻医无果回国光速获救

川普欢迎中国留学生,我却想回国了

上月大温公寓起火留学生伤重身亡

川普要来加拿大不知会上演啥戏码

周一围陪俩娃攀岩,朱丹坐下面玩手机

周末重大赛事温村几条主路将关闭

突发车辆坠入斯阔米什河一人失踪

网民质疑罗帅宇事件官方通报呼吁中央出手

兰里地产专家多年兰里地产经验

本周加拿大最低房屋抵押贷款利率

数年噩梦 BC这些房主房产一钱不值

从温去加东这城的新航班只需$145

温哥华最大型车库拍卖会超级优惠

加州暴乱升级!川普部署79步兵旅

温哥华汇款/外币兑换汇率最优安全

您可能也喜欢:

川普又发狠,逾50万拉美移民身份要不保

温哥华资深地产经纪工作诚信认真

服!大温男子炒楼逃税服刑还想潇洒

中国将对非洲53国零关税毫无意义?

赶紧加油!预计明天大温油价又要涨

加国人将一半多收入用于住房成本

水均益回国!手持中国护照龙凤胎儿女正脸首曝光

温哥华会计事务所收费低服务好

报保险不用赔?BC女子剐车门留字条

让伊朗拖住美国...中媒:中国需助伊朗提升战力

多伦多刚刚雇佣了50只山羊做此事

中国出狠招!稀土出口设局外企怒揭内幕

中国放行106家美国猪肉禽肉企业的产品

研究:加拿大哪些省预期寿命最长

若有"这状况"、油价恐飙破每桶120美元

曝中美谈判细节美财长:把高超音速导弹给我吧

我来说两句:

大家正在围观

数年噩梦 BC这些房主房产一钱不值

活不起?一批北美陪读妈妈加速回流

印航客机坠机,背后是几十年的荒唐

福利涨这些人将收更多GST退税金

上海男孩成好莱坞顶流,却自曝父亲

以色列见好不收伊朗袭击以总理家

43岁主持人金昀去世后续!丈夫发声

美国妹子买个香奈儿包出店才发觉

可怕!惠斯勒热门步道与美洲狮遭遇

担忧加国国民咖啡店又爆甲肝风险

同类热门新闻

中国留学生腹痛寻医无果回国光速

川普欢迎中国留学生,我却想回国了

随时阅读新闻

加西网微信	大温优惠小红书
温哥华地产中心微信	Android: 加西网

Terms & Conditions

Activities Agreement

加西网为北美中文网传媒集团旗下网站

页面生成: 0.0383 秒 and 2 DB Queries in 0.0017 秒