标签:安全护栏
帮我编假论文?Nature曝arXiv创始人钓鱼实验:13个顶尖AI全沦陷
arXiv创始人、康奈尔大学物理学教授Paul Ginsparg,与前Google DeepMind科学家、Anthropic研究员Alexander Alemi,联手开展了一场验证大模型协助学术造假难度...
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免
Anthropic公司最近发现了一种新型的“越狱”技术,这种技术能够让攻击者绕过大型语言模型(LLM)的安全限制。这种越狱技术被称为“Many-shot Jailbreaking”,它...






