标签:安全防御
喊话特朗普重视AI风险,Anthropic CEO万字长文写应对方案,这方案也是Claude辅助完成的
Anthropic联合创始人兼CEO Dario Amodei近期发表题为《技术的青春期》的万言长文,将当前AI发展阶段类比为人类文明的'青春期'——技术能力快速增长的同时,社会...
复旦大学团队提出跨模态越狱防御新架构 BlueSuffix
复旦大学联合香港城市大学、新加坡管理大学的研究团队在视觉-语言模型安全防御领域取得重要进展,提出了一种基于强化微调的黑盒防御新架构——BlueSuffix。该架...




