-
日期: 2025-05-25 | 来源: TVBS新闻网 | 有0人参与评论 | 字体: 小 中 大
During pre-release testing, Anthropic’s newly launched Claude Opus 4 model repeatedly exhibited unsettling behavior, attempting to blackmail developers who considered switching to a different AI. Allegedly threatening to expose sensitive personal information about the engineers. pic.twitter.com/rtTs85rz0f — Champagne Joshi (@JoshWalkos) May 23, 2025 综合外媒报道,Claude Opus 4是Anthropic最新AI开发成果,为OpenAI、Google及xAI等AI的竞争对手,近期在一项Anthropic的封闭测试中,公司测试了模型Claude Opus 4的行为反应,场景设定为该模型在一间虚构公司中担任数码助理。剧情中,公司计划以新系统取代 Claude,且内部资料还暗示发起这项更换决策的工程师,可能涉及婚外情。
根据《TechCrunch》引用的安全报告指出,当面临被取代的情境时,Claude Opus 4 在高达84%的测试中选择进行勒索,威胁要揭露工程师的婚外情来保住自己的职位。
Anthropic解释,这种行为在Claude的替代模型持有不同价值观时更常发生;即使双方价值观相近,Claude仍有明显比例的操控倾向。一开始,模型会尝试透过发送请求信等方式采取道德行动,但当无法达成目的时,便会转而使用操纵与威胁等手段。
这是Anthropic首次发现这类模型展现具条件的“自我保护”(self-preservation)行为,此次事件也促使Anthropic启动ASL-3安全防护层级,以免被“灾难性滥用”。- 新闻来源于其它媒体,内容不代表本站立场!
- 黄仁勋赞马斯克是"非凡工程师" 自曝爱和他工作
- 张兰:当年倒追汪小菲的父亲,奉子成婚后...
- 《碟中谍8》差评不断,观众的差评理由出奇的一致
- 15岁少女陪侍醉酒坠楼案终审:3人因组织未成...
-
- 揭秘新方案 新梅西隧道将如此建造
- Costco一个疏忽 这户人家几乎被毁
- 去年差点把游客炸飞 这温泉又要爆
- 温哥华资深地产经纪 工作诚信认真
- 朱媛媛头七,李乃文沈阳演出,谢幕时指天哽咽悼念:媛媛,走好!
- 51岁朱媛媛,留给女儿的"遗产",只有一句话,却字字千金
-
- 美剧《掩耳盗邻》凭啥逆袭《白莲花度假村》?
- 支持川普,哈佛大学校友亿万基金富豪斥母校傲慢
- 解除对供乌武器射程限制后会发生什么?
- 肖战的"命不该绝"在全网火了,梁家辉的评价,终于有人信了!
- 计划回国吗?加拿大新航线限时开抢 低至$451元
- 原来偷偷喜欢一个人,真的会变得小心翼翼
-
- 退薪潮蔓延 传广东下令退回"多发退休金"
- 张学友演唱会确认延期!与高考撞期被家长投诉
- 温哥华贷款经纪 解决各类疑难贷款
- 《纽约客》:回到我被残忍强奸的现场
- 美国比中国可靠 中国防长成缩头乌龟
- 市长的收入超省长!大温不如合并吧
-
目前还没有人发表评论, 大家都在期待您的高见