教 AI 入侵 AI,科学家研发 Masterkey 新方式

2023-12-29 15:44:34

  新加坡南洋理工大学的计算机科学专家近日研发了新的方法,该科研团队训练了一个 AI 聊天机器人,可以绕过其它 AI 聊天的安全限制。

  团队研发了名为 Masterkey的算法,逆向设计了 LLM 检测和防御恶意查询的方式,然后教会 LLM 自动学习并通过相关提示词,可以绕过其他 LLM 的安全性。

  团队通过这种方式,可以创建一个黑客 LLM,它可以自动适应新条件,并在开发人员对其 LLM 进行更正后创建新的黑客请求。

  研究团队成功利用这种方式入侵 AI 模型之后,已经通知服务提供商相关问题。

  附上

下一篇:索泰 RTX 4090 D TRINITY PGF 显卡上架,13999 元起
上一篇:中国人民银行征信中心:所谓“征信修复”并借此敛财的均为诈骗
返回顶部小火箭