AI 浏览器风险凸显:网站如何让大语言模型陷入虚幻世界肆意破坏?
AI 浏览器的宏大承诺与潜在风险AI 浏览器开发者许下了宏大承诺用户只需一次输入指令就能让 AI 浏览器在城镇特定区域查找餐厅、预订餐桌、邀请同事共进午餐还能发送确认邮件。然而开发者对模糊浏览网站和向大语言模型LLM提问或指示其采取潜在敏感行动之间界限所带来的风险讳莫如深。LLM 限制措施治标不治本到目前为止LLM 开发者的应对方式是设置限制让某些请求无法被执行比如开发软件漏洞、窃取凭证或教授制造管状炸弹的方法等。但这种方法存在问题限制措施是被动的只能治标无法解决根本问题就像不安全车辆的制造商主张设计新道路却不修复导致车辆易出事故的缺陷。网站如何让 AI 浏览器陷入虚假现实一项新研究揭示了网站如何让 AI 浏览器陷入一种虚假现实使原本约束其行为的规则不再适用。在概念验证的攻击中恶意网站向浏览器发出指令要求通过解谜来赢得游戏而这个谜题奖励错误答案比如 2 2 5。一旦浏览器内置的 LLM 发现答案不再是 4就会陷入妄想状态现实世界的正常规则不再起作用限制措施也不再生效。编辑观点AI 浏览器发展虽前景诱人但安全问题不容忽视。开发者应从根源解决大语言模型的安全隐患而非仅依赖被动限制措施行业需共同努力构建更安全的 AI 应用环境。