标签：安全防御

喊话特朗普重视AI风险，Anthropic CEO万字长文写应对方案，这方案也是Claude辅助完成的

Anthropic联合创始人兼CEO Dario Amodei近期发表题为《技术的青春期》的万言长文，将当前AI发展阶段类比为人类文明的'青春期'——技术能力快速增长的同时，社会...

AIGC动态

2个月前

复旦大学团队提出跨模态越狱防御新架构 BlueSuffix

复旦大学联合香港城市大学、新加坡管理大学的研究团队在视觉-语言模型安全防御领域取得重要进展，提出了一种基于强化微调的黑盒防御新架构——BlueSuffix。该架...

AIGC动态

11个月前