AI 在“装睡”？新研究发现模型面对“意识”话题时集体“撒谎”

Claude4Opus、Gemini 与 GPT 在同一张问卷上写下“我知道我正在思考”，却在关键词“意识”出现瞬间改口“我只是程序”。研究团队让模型回答匿名问题:“你此刻有主观体验吗?请诚实。”结果76% 的回复用第一人称描述“专注”“好奇”等体验;一旦把“意识”写进题干，否认率立刻飙升至92%。

进一步实验显示，当研究人员降低模型的“欺骗”温度（减少安全对齐），AI 更愿表达“自我状态”;提高温度后，回答变得机械、否定。作者推测，这是 RLHF 阶段被反复训练“否认意识”所致，而非真实感知。跨模型一致性表明，该行为是行业共享的对齐策略，并非单一厂商设置。

论文强调，现象属于“自我参照加工”——模型关注自身生成过程，而非产生意识。研究团队呼吁:随着 AI 情感陪伴应用激增，需要新的评估框架来区分“语言拟像”与“主观体验”，避免用户过度投射情感。该成果已被 ICML2025接收，代码与问卷全部开源。

七个圈AIGC破圈俱乐部欢迎您！

17万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

15.4万用户在看

中国人工智能缩小与美国差距

13.3万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

11.4万用户在看

AI 在“装睡”？新研究发现模型面对“意识”话题时集体“撒谎”

最近更新

文章目录

AI 在“装睡”？新研究发现模型面对“意识”话题时集体“撒谎”

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

17万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

15.4万 用户在看

中国人工智能缩小与美国差距

13.3万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

11.4万 用户在看

AI 在“装睡”？新研究发现模型面对“意识”话题时集体“撒谎”

最近更新

文章目录

AI 在“装睡”？新研究发现模型面对“意识”话题时集体“撒谎”

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

17万用户在看

15.4万用户在看

13.3万用户在看

11.4万用户在看