OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易

2025-08-28 09:31:48

　　OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

　　OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自[*]计划而最终自[*]，面临首起不当[*][*]诉讼。

　　另一方面，OpenAI 对 Anthropic 的 Claude 模型进行了在此前 OpenAI 被指在构建新 GPT 模型时违反 Anthropic 服务条款，使用程序员操作 Claude，导致参考