OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易
OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。
OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自[*]计划而最终自[*],面临首起不当[*][*]诉讼。
另一方面,OpenAI 对 Anthropic 的 Claude 模型进行了在此前 OpenAI 被指在构建新 GPT 模型时违反 Anthropic 服务条款,使用程序员操作 Claude,导致 参考