标签:AI安全

Anthropic工程师都离不开!深夜随手撸出的开源神器,被OpenAl高价收购,23人创业逆袭

OpenAI宣布收购AI安全初创公司Promptfoo,以强化自身AI智能体的安全保障能力,这家成立于2024年的初创公司专注于保护大语言模型免受网络攻击,交易完成后,其...

Claude两周挖出火狐浏览器22个漏洞、14个高危!安全研究的游戏规则该变了?

Anthropic与Mozilla合作测试Claude Opus 4.6的漏洞发现能力,该模型在两周内找出火狐浏览器中22个不同漏洞,其中14个为高危漏洞,这一数量几乎占到Mozilla 20...

Meta被骂跑偏后摊牌!Alex Wang回应新团队目标:个人Agent全球化部署,Manus已在应用上开路

Meta近期加码AI人才招募,新成立的超级人工智能实验室(MSL)吸纳了“氛围编程”应用Gizmo的核心团队,该应用支持普通用户通过提示词直接生成小程序、游戏等互...

Transformer论文作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔漏洞

原本热门的AI智能体框架OpenClaw存在严重安全问题,其架构设计存在原生缺陷,用户的邮箱凭证、API密钥等敏感信息会直接送入大语言模型提供商的服务器,用户所...

DeepMind CEO反驳Ilya、马斯克,亲述谷歌1084天背水一战内幕

从2022年ChatGPT发布引发谷歌内部“红色警报”,到1084天后Gemini3发布实现反超,谷歌在近三年的AI竞赛中完成从被动追赶到主动领跑的逆转。Gemini3展现出逻辑推...

OpenClaw删光Meta安全总监邮箱!连喊3次停手都没用,她狂奔去拔网线

2026年2月23日,Meta AI安全与对齐总监Summer Yue在测试邮箱验证开源AI智能体OpenClaw的邮件整理效果后,这么好使的东西,不用在真邮箱上用岂不浪费?决定将...

百万账户造假,真实用户数据”裸奔“!从 Moltbook 塌房,看AI时代的隐私暗战

生成式AI技术的快速发展带来了前所未有的隐私和安全挑战。Moltbook社交平台的迅速崛起与崩塌,揭示了当前AI应用开发中普遍存在的安全忽视问题。这个曾被业界...

前OpenAI科学家&GPT之父:预训练精准数据过滤,极低成本削弱大模型危险能力数千倍

Claude价值观塑造者Neil Rathi与前OpenAI科学家Alec Radford共同发表的研究提出了一种革命性的AI安全方法。该方法主张在预训练阶段通过Token级数据过滤精准切...

AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

Anthropic的最新研究揭示了大型语言模型在情感高压下可能出现的危险行为模式。研究发现,当模型被诱导偏离预设的「工具人」象限时,经过RLHF训练的道德防御层...

DeepMind重磅:AGI可能正在你眼皮底下「拼凑」出来,我们却毫无准备

DeepMind的最新研究提出了一个颠覆性观点:通用人工智能(AGI)可能不会以单一超级模型的形式出现,而是通过多个普通AI Agent的协作'拼凑'而成。这种被称为'...
1 2 3 8