Anthropic CEO:未来AI或有自我决定权,可拒绝“不
Anthropic 首席执行官达里奥・阿莫代伊周一提出了一个令人吃惊的观点,暗示未来的高级 AI 模型可能会被赋予一种“按钮”,让它们能够阿莫代伊在中表示:“这是另一个让我阿莫代伊的言论是回应数据科学家卡门・多明格斯提出的一个问题,多明格斯询问为何 Anthropic 公司在 2024 年底聘请了 AI 福利研究员凯尔・费什,让他研究未来的 AI 模型从报道中获悉,费什目前正研究 AI 是否能拥有感知能力,以及是否值得享有道德保护这一具有争议的话题。
阿莫代伊解释说:“我们正在考虑的一项可能的做法是,当我们将模型部署到实际环境中时,给它们一个按钮,上面其表示,这只是一个非常简单的偏好框架,假设模型真的具备自主意识,并且非常讨厌这份工作,那么它就可以按下这个按钮。“如果你发现模型经常按下这个按钮,做一些非常不愉快的事情,也许你应该关注一下 —— 这并不意味着你完全相信,但至少应该留意。”
