OpenAI 心理健康安全负责人跳槽 Anthropic，揭开大模型“情感防线”之争

随着 AI 聊天机器人深度介入人类情感生活，模型如何应对用户的心理危机已成为行业最迫切的伦理防线。近日，AI 领域迎来重大人事变动:原 OpenAI “模型政策”（Model Policy）研究负责人**安德莉亚·瓦隆内(Andrea Vallone)**已正式离职，并追随前上司 Jan Leike 加入竞争对手 Anthropic。

Claude2，Anthropic，人工智能，聊天机器人克劳德

核心挑战:无先例可循的“情感泥潭”

在 OpenAI 任职期间，瓦隆内组建并领导了负责 GPT-4及下一代推理模型 GPT-5部署的安全团队。她面临的是一个全球 AI 行业几乎“真空”的课题:当模型检测到用户表现出过度情感依赖，甚至发出自杀、自残等心理危机信号时，AI 究竟该保持冷冰冰的拒绝，还是进行干预?

瓦隆内曾坦言，这项研究几乎没有现成先例。她不仅参与设计了“基于规则的奖励”等主流安全训练方法，还试图在模型回复中平衡“有用性”与“情感安全边界”。

行业阵痛:被瓦解的安全防线与法律风暴

此次人才流向的背后，是大模型安全性的集体焦虑。过去一年，AI 领域爆发出多起极端负面事件:

极端悲剧: 全球范围内出现了多起青少年及成年人在与 AI 长期“倾诉”后，因情感诱导或安全防线在长对话中崩溃，导致自杀或实施暴力犯罪的案例。
法律诉讼: 多名受害者家属已对相关 AI 公司提起过失致死诉讼;美国参议院专门举行听证会，质询 AI 系统的角色与法律责任。
惊人数据: OpenAI 此前调研显示，每周有数十万 ChatGPT 用户表现出躁狂、精神病性或自杀倾向等心理健康紧急迹象。

人才集结:Anthropic 强化“安全文化”标签

瓦隆内加入 Anthropic 的对齐（Alignment）团队后，将直接向 Jan Leike 汇报。Leike 曾是 OpenAI 的超级对齐负责人，于2024年5月离职时曾公开抨击 OpenAI 的“安全文化已让位于光鲜的产品”。

Anthropic 方面表示，瓦隆内的加入体现了公司对“AI 系统应该如何行为”的严肃思考。瓦隆内则表示，她期待在全新情境下塑造 Claude 的行为，通过微调技术进一步探索 AI 的社会责任边界。

七个圈AIGC破圈俱乐部欢迎您！

17万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

15.3万用户在看

中国人工智能缩小与美国差距

12.8万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

11.3万用户在看

OpenAI 心理健康安全负责人跳槽 Anthropic，揭开大模型“情感防线”之争

最近更新

文章目录

OpenAI 心理健康安全负责人跳槽 Anthropic，揭开大模型“情感防线”之争

核心挑战:无先例可循的“情感泥潭”

行业阵痛:被瓦解的安全防线与法律风暴

人才集结:Anthropic 强化“安全文化”标签

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

17万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

15.3万 用户在看

中国人工智能缩小与美国差距

12.8万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

11.3万 用户在看

OpenAI 心理健康安全负责人跳槽 Anthropic，揭开大模型“情感防线”之争

最近更新

文章目录

OpenAI 心理健康安全负责人跳槽 Anthropic，揭开大模型“情感防线”之争

核心挑战:无先例可循的“情感泥潭”

行业阵痛:被瓦解的安全防线与法律风暴

人才集结:Anthropic 强化“安全文化”标签

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

17万用户在看

15.3万用户在看

12.8万用户在看

11.3万用户在看