-
_NEWSDATE: 2025-05-25 | News by: TVBS新闻网 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
During pre-release testing, Anthropic’s newly launched Claude Opus 4 model repeatedly exhibited unsettling behavior, attempting to blackmail developers who considered switching to a different AI. Allegedly threatening to expose sensitive personal information about the engineers. pic.twitter.com/rtTs85rz0f — Champagne Joshi (@JoshWalkos) May 23, 2025 综合外媒报道,Claude Opus 4是Anthropic最新AI开发成果,为OpenAI、Google及xAI等AI的竞争对手,近期在一项Anthropic的封闭测试中,公司测试了模型Claude Opus 4的行为反应,场景设定为该模型在一间虚构公司中担任数码助理。剧情中,公司计划以新系统取代 Claude,且内部资料还暗示发起这项更换决策的工程师,可能涉及婚外情。
根据《TechCrunch》引用的安全报告指出,当面临被取代的情境时,Claude Opus 4 在高达84%的测试中选择进行勒索,威胁要揭露工程师的婚外情来保住自己的职位。
Anthropic解释,这种行为在Claude的替代模型持有不同价值观时更常发生;即使双方价值观相近,Claude仍有明显比例的操控倾向。一开始,模型会尝试透过发送请求信等方式采取道德行动,但当无法达成目的时,便会转而使用操纵与威胁等手段。
这是Anthropic首次发现这类模型展现具条件的“自我保护”(self-preservation)行为,此次事件也促使Anthropic启动ASL-3安全防护层级,以免被“灾难性滥用”。- 新闻来源于其它媒体,内容不代表本站立场!
- 黄仁勋赞马斯克是"非凡工程师" 自曝爱和他工作
- 华裔女孩:搞AI成亿万富翁,穿搭火辣,满身LV
- 温哥华夏日狂欢PNE游园会精彩纷呈
- 温哥华机场数十个航班延误或取消
-
- 网友称未拆封一次性餐具有蟑螂乱爬,生产厂家回应
- BC鹿群凶猛 狗狗在家门前遭袭惨死
- 新变种开始全球传播 新冠病例上升
- 大温女子家门前遭遇黑熊 被咬一口
- 温哥华牙医诊所 提供全面牙科服务
- 全面更新作战核心指挥链!传中共军中再抓四虎
-
- 周日起BC省的最低工资涨至这个数
- 中国补贴占比高5倍,这份报告痛陈北京做法
- 教授称广东人烫碗"恶心",网友们坐不住了
- 兰里地产专家 多年兰里地产经验
- 地产协会敦促BC放宽短期租赁规则
- 捷克强烈谴责中国 支持骇客攻击该国外交部
-
- 突发!美国暂停新的学生签证面试
- 5亿加元面包和解金 你如何拿到钱
- 加拿大前总理特鲁多之子出道:想和Drake合作
- 这种情况你的信用将清零 陷入困境
- 肖战的"命不该绝"在全网火了,梁家辉的评价,终于有人信了!
- 首次接受质询 新总理卡尼表现如何
-
目前还没有人发表评论, 大家都在期待您的高见