标签：对抗攻击

计算所程学旗团队：随机剪枝 AI 攻击策略，让对抗样本更具「通用攻击力」丨CVPR 2026

深度学习已广泛应用于自动驾驶、智能安防、医疗影像分析、智能终端等计算机视觉关键场景，但深度神经网络存在决策边界脆弱性问题，人类几乎无法察觉的微小输...

AIGC动态

2周前

港科、北交、复旦等提出针对 VLM 的大规模预训练对抗攻击 AnyAttack | CVPR 2025

近年来，视觉语言模型（VLMs）在多模态AI领域展现了重要的研究价值和应用潜力，但其安全性问题也逐渐受到关注。传统对抗攻击方法依赖预设标签，难以适应大规...

AIGC动态

11个月前

强化学习成帮凶，对抗攻击LLM有了新方法

威斯康星大学麦迪逊分校的研究团队最近发现，强化学习可以被用于实施黑盒逃避攻击，即通过生成对抗样本来欺骗机器学习模型。这一发现揭示了强化学习在攻击AI...

AIGC动态

1年前 (2025)

揭秘多轮越狱攻击新框架：RACE 如何利用大模型推理能力突破安全防线？

来自北京航空航天大学等机构的研究团队提出RACE多轮越狱攻击框架，通过将有害查询转化为良性推理任务，成功突破多个主流大模型的安全防线。实验结果显示，该...

AIGC动态

1年前 (2025)