-
日期: 2026-01-12 | 来源: DeepTech深科技 | 有2人参与评论 | 字体: 小 中 大近日,清华大学团队从 AI 里找到了与幻觉产生高度关联的少数“脑细胞”,并给它们起了一个名字 H-神经元(幻觉神经元)。他们发现拨动这些小开关能显著调节 AI 的行为倾向——例如影响它是否会盲目听从错误指令、甚至是否会产生有害回答。
这一研究让人们第一次清晰地看到幻觉是如何从机器的神经层面产生的。它可以帮助我们更好地检测 AI 什么时候在撒谎,未来也可以通过微调这些小开关,造出更加诚实、更加可靠的 AI 助手。

图 | 高骋(来源:高骋)
AI幻觉从何而来?如何找到关键幻觉因素?
对于大模型来说,我们可以把其想象成为一个由数千亿个脑细胞(在 AI 里叫神经元)连接成的超级网络。它通过阅读互联网的海量信息来学习,学习目标很简单,就是根据前面的文字,预测下一个最有可能出现的词语。比如看到“天空是什么颜色的”,它大概率会学会接“蓝色的”。
但这种学习方式埋下了一个隐患:模型只被训练生成通顺的文字,而不是正确的答案。当它遇到自己不确定或者根本没学过的知识,为了完成只说出一个通顺句子的任务,它就可能凭感觉编造出一个答案。
此前,人们大多从整体上研究这个问题,比如检查训练数据是否有偏差,或者让 AI 自己输出置信度。但是,这就像只知道一个人发烧,却不知道哪个器官感染了一样。本次清华团队的创新之处在于,他们决定拿起显微镜直接去观察 AI 大脑内部里的数千万甚至数亿个神经元,看看当 AI 在撒谎的时候,到底是哪些神经元在活跃。
(来源:资料图)
相关论文第一作者、清华大学硕士生高骋告诉 DeepTech:“目前工业界对减轻幻觉的关注相对有限,但学术界已做了许多努力。不过,多数研究仍停留在表层,将模型视为黑盒,通过后训练、调整数据等方式打补丁,未能从根本上理解幻觉机制。因此,我们希望借鉴神经科学的思路,从模型内部神经元入手,真正理解幻觉的产生原理,为未来彻底解决该问题提供新的视角。”
为此,高骋和所在团队准备了一套寻找方法:
首先,他们备好一批测试题和标准答案,使用了一个名为 TriviaQA 的知识问答数据集来向 AI 模型提问。对于每个问题,他们都让 AI 生成很多遍答案。如果 AI 每次都能答对,这个答案就被标记为真实;如果 AI 每次都在同一个问题上犯错,并且不是回答“我不知道”,而是坚定地给出错误答案,那么这个答案就被标记为幻觉。
当 AI 生成答案的时候,他们使用了一套名为 CETT 的测量技术,仔细记录下每个神经元的活跃度贡献值,就像测量每个脑细胞在说出那个答案时付出了多大力气一样。研究人员特别关注答案关键词比如“爱因斯坦”一词被说出来的那一刻的神经元活动。- 新闻来源于其它媒体,内容不代表本站立场!
- 脊损新疗法 瘫痪者成功再次行走
- 温哥华贷款经纪 解决各类疑难贷款
- 又来了!47岁赵又廷和小17岁张子枫上演忘年恋,让国产剧咋玩啊
- 司机160公里超速行驶被抓 找借口
- 收藏:Costco最值得买的19件商品 值回"会员费"
-
- 加国新食品标签见过吗?专家称有效
- Costco省33%?这份特别优惠攻略必看
- BC女子开枪案神仙操作:上帝当律师
- 5人进山3人遇难,鳌太线越网红越危险....
- 才播5集,收视率全国第一!央视这部年代剧,又是2026年度黑马
- 大温一处民宅发生火灾 导致了封路
-
- 何时轮到蔡奇?元老剑指陈敏尔和丁薛祥
- 戴着脚镣的马杜罗:我是委内瑞拉总统 在家中被绑架
- 力邦艺术港 展览活动拍摄场地租赁
- 日媒竟帮腔:特朗普想要格陵兰,是为了中国
- BC双重谋杀案嫌犯不到1月前才抵加
- 大变局:动手掐住中俄咽喉要道,美方下周启动
-
- 强硬拿岛!川普不装了加拿大也危险
- 胡锡进:取消光伏产品出口退税,具有里程碑意义
- 多年隐忍后,鲍威尔选择与川普正面硬刚
- 这数据出炉 降低加央行加息可能性
- 日本人,为何能够坦然接受出轨和嫖娼?
- 加国应禁止水煮龙虾?有教授这么说
-