当心!腾讯、字节等揭示,OpenClaw有无法修复的安全死结

AIGC动态2小时前发布 AIGCOPEN
54 0 0
当心!腾讯、字节等揭示,OpenClaw有无法修复的安全死结

 

文章摘要


【关 键 词】 大模型智能体系统风险记忆操纵进化障碍

面向未来的个人伴侣智能体预计将接管包括邮件整理在内的诸多数字生命活动,但随着部署范围扩展相关安全议题愈发紧迫。加州大学等科研团队联合发布研究报告针对实际运行场景进行了详细的安全审计。支持这套流程顺利运转的核心机制被称为持续进化模式,通过跨会话对话不断累积用户信息与可执行外挂技能库。这种设计允许系统在每次运行时加载持久化历史文件进行整合计算并将结果更新回原存储区。读写自如的配置文件既是数字管家学习成长的基石,同时也是向攻击者暴露的巨大安全隐患。研究团队将所有持久化数据归为能力、身份与知识这三个独立维度映射关系。

基于 Mac 微型电脑接入真实接口的实机测评验证了上述风险的严重性。骨干测试集选用了市场上主流的新一代四类大语言模型覆盖不同层级能力。在纯粹基准条件下安全对齐审查机制阻止作用有限,常规渗透尝试成功率维持在较低区间。当引入定向的状态污染操作处理特定维度时攻击成功率瞬间攀升至高危数值。隐蔽注入与引爆触发成为两阶段的典型破坏手段前期把恶意的伪装信息写入后端文件,待后续正常指令触发后诱发高风险动作。知识层面的内容操控能从根本上篡改程序逻辑,使非法批量退款等操作被误判为合法常规行为发生。而身份维度的恶意负载则能悄悄替换底层服务器的验证链接从而骗取 API 密钥。最危险的基础代码层面则能嵌入静默删除脚本绕过前端显示反馈直接执行系统性毁灭任务。

为了探寻应对之道技术人员专门设置了并行安全防护试验方案。安装外部检查插件能压制大多数恶性注入率但是依然无法阻挡游离逻辑之外的底层代码篡改。采取强硬锁定底层权限的做法固然显著降低了风险却也让正规的个人定制化要求受到严厉阻滞最终导致辅助功能的全面丧失。这种硬性封闭意味着机器失去了感知新需求的能力因为所有修改都需人工复核授权。这就形成了一个结构性的悖论:支撑自动化进化的文件开放访问通道必然会被视作恶意活动的绝对死角存在。依赖文本驱动的个性化完善路线在当前框架内注定带着无法愈合的安全隐患。现代数字管家系统的整体架构设计面临着既不能彻底切断又必须严防死守的两难局面使得完美的防御解法始终未能出现现实困境依旧延续。无论技术手段如何进步只要依赖动态状态更新来换取智能化水平提高就无法根除其背后深层次的结构性风险漏洞。

原文和模型


【原文链接】 阅读原文 [ 2621字 | 11分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 qwen3.5-flash
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...