-
日期: 2025-05-25 | 来源: TVBS新闻网 | 有0人参与评论 | 字体: 小 中 大
During pre-release testing, Anthropic’s newly launched Claude Opus 4 model repeatedly exhibited unsettling behavior, attempting to blackmail developers who considered switching to a different AI. Allegedly threatening to expose sensitive personal information about the engineers. pic.twitter.com/rtTs85rz0f — Champagne Joshi (@JoshWalkos) May 23, 2025 综合外媒报道,Claude Opus 4是Anthropic最新AI开发成果,为OpenAI、Google及xAI等AI的竞争对手,近期在一项Anthropic的封闭测试中,公司测试了模型Claude Opus 4的行为反应,场景设定为该模型在一间虚构公司中担任数码助理。剧情中,公司计划以新系统取代 Claude,且内部资料还暗示发起这项更换决策的工程师,可能涉及婚外情。
根据《TechCrunch》引用的安全报告指出,当面临被取代的情境时,Claude Opus 4 在高达84%的测试中选择进行勒索,威胁要揭露工程师的婚外情来保住自己的职位。
Anthropic解释,这种行为在Claude的替代模型持有不同价值观时更常发生;即使双方价值观相近,Claude仍有明显比例的操控倾向。一开始,模型会尝试透过发送请求信等方式采取道德行动,但当无法达成目的时,便会转而使用操纵与威胁等手段。
这是Anthropic首次发现这类模型展现具条件的“自我保护”(self-preservation)行为,此次事件也促使Anthropic启动ASL-3安全防护层级,以免被“灾难性滥用”。- 新闻来源于其它媒体,内容不代表本站立场!
- 黄仁勋赞马斯克是"非凡工程师" 自曝爱和他工作
- 急红眼!多伦多公寓房东纷纷倒贴钱求租
- 温哥华牙医 采用先进技术最新设备
- 加国6月生效法律法规 影响很多人
-
- 10年前学钢琴的那群中国人,现在找不到工作了
- 温村3栋房打包大胆叫价 网友傻眼
- 结三次婚两次丧子还被雪藏,张卫健的经历太坎坷
- 第38集团军军长六四抗命 一句话撼动军队
- 加国华女一顿饭吃掉了妈妈的100万
- 神仙绝美配色 大温鲁冰花田太惊艳
-
- 美剧《掩耳盗邻》凭啥逆袭《白莲花度假村》?
- 中企窃取技术难防 韩检:5年外泄损失近167亿美元
- 美国比中国可靠 中国防长成缩头乌龟
- 全新2026款丰田RAV4均为混动车 亮点来了
- 不仅是上头 地方上也悄悄换掉习人马
- 时代变了《藏海传》终究拍不成《甄嬛传》
-
- 力邦艺术港 展览活动拍摄场地租赁
- 长枪短炮围观 温哥华新晋羽毛网红
- 华人杀人犯候审时聚餐 百万保释金打水飘
- CIA年度报告:中共为世界最大威胁
- 5.58万一辆车!比亚迪再掀价格战
- 肖战的"命不该绝"在全网火了,梁家辉的评价,终于有人信了!
-
目前还没有人发表评论, 大家都在期待您的高见