标签:知识隔离

比传统方法强7倍:Anthropic物理隔离危险知识,重塑大模型安全训练范式

Anthropic研究团队联合多所高校及机构,提出了一项名为选择性梯度掩码(SGTM)的创新技术,旨在解决大语言模型在安全领域的核心挑战。该技术通过物理隔离危险...