标签：安全护栏

帮我编假论文？Nature曝arXiv创始人钓鱼实验：13个顶尖AI全沦陷

arXiv创始人、康奈尔大学物理学教授Paul Ginsparg，与前Google DeepMind科学家、Anthropic研究员Alexander Alemi，联手开展了一场验证大模型协助学术造假难度...

AIGC动态

6小时前

长文本之罪：Claude团队新越狱技术，Llama 2到GPT-4无一幸免

Anthropic公司最近发现了一种新型的“越狱”技术，这种技术能够让攻击者绕过大型语言模型（LLM）的安全限制。这种越狱技术被称为“Many-shot Jailbreaking”，它...

AIGC动态

2年前 (2024)