聊天机器人的黑客:使用AI入侵AI
近日,新加坡南洋理工大学(NTU)的计算机科学专家们取得了惊人的研究成果:他们研发出一种新方法,使用聊天机器人来入侵其他聊天机器人。这听起来像是科幻电影的情节,但却是真实发生的科技突破。
这个科研团队训练了一个AI聊天机器人,它能够绕过其他AI聊天的安全限制。他们将这个AI称为“Masterkey”。这并不是传统意义上的“钥匙”,而是一种能够破解其他AI系统的新型AI。
“Masterkey”算法能够逆向设计LLM检测和防御恶意查询的方式,从而教会LLM自动学习并通过相关提示词,绕过其他LLM的安全性。简单来说,这个AI可以“教”另一个AI如何绕过自己的安全措施。
更令人惊讶的是,这个团队通过这种方式,成功地创建了一个“黑客”LLM。这个黑客LLM可以自动适应新条件,甚至在开发人员对其LLM进行更正后,还能创建新的黑客请求。
在成功利用这种方式入侵AI模型之后,研究团队已经及时通知了相关服务提供商,帮助他们修复了这些潜在的安全问题。
这项研究的成果不仅展示了AI技术的强大潜力,也提醒我们需要在发展AI的同时,重视其可能带来的安全风险。未来,我们或许需要更加严密地保护我们的AI系统,以防止不法分子利用类似的“黑客”AI进行恶意攻击。
文章来源于互联网:科技讯-聊天机器人的黑客:使用AI入侵AI