标签:AI安全

DeepMind之父惊人自白:我造的AI可能灭绝人类,但已无人能停下

哈萨比斯从理想主义到现实主义的转变,标志着AI安全治理思路的根本性转向。他长期致力于构建“单体治理”模式,主张由少数精英在封闭环境中开发绝对安全的超级...

90分钟攻破20年Linux漏洞!Claude 5.0惊现内测,Anthropic都害怕

Claude Mythos 5.0 Beta已进入内测阶段,并在Claude与Claude Code中正式现身,被官方定义为“规模更大、更智能”的升级版本。该模型在编程能力与逻辑推理上表现...

手握190亿ARR还要急着IPO:Anthropic高光背后的生存赌局

Anthropic正面临一场关键的转折点:在未上市前已实现190亿美元年经常性收入(ARR),其规模接近OpenAI一半,但企业客户对其安全人设的信任危机与算力依赖风险...

我天,腾讯这是给龙虾做了个安全护栏。

当前AI代理如“龙虾”(OpenClaw)在本地部署时虽具备强大执行能力,但因用户提示词模糊或操作失控,存在误删文件、越权访问等风险。例如某用户通过语音指令让A...

Anthropic工程师都离不开!深夜随手撸出的开源神器,被OpenAl高价收购,23人创业逆袭

OpenAI宣布收购AI安全初创公司Promptfoo,以强化自身AI智能体的安全保障能力,这家成立于2024年的初创公司专注于保护大语言模型免受网络攻击,交易完成后,其...

Claude两周挖出火狐浏览器22个漏洞、14个高危!安全研究的游戏规则该变了?

Anthropic与Mozilla合作测试Claude Opus 4.6的漏洞发现能力,该模型在两周内找出火狐浏览器中22个不同漏洞,其中14个为高危漏洞,这一数量几乎占到Mozilla 20...

Meta被骂跑偏后摊牌!Alex Wang回应新团队目标:个人Agent全球化部署,Manus已在应用上开路

Meta近期加码AI人才招募,新成立的超级人工智能实验室(MSL)吸纳了“氛围编程”应用Gizmo的核心团队,该应用支持普通用户通过提示词直接生成小程序、游戏等互...

Transformer论文作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔漏洞

原本热门的AI智能体框架OpenClaw存在严重安全问题,其架构设计存在原生缺陷,用户的邮箱凭证、API密钥等敏感信息会直接送入大语言模型提供商的服务器,用户所...

DeepMind CEO反驳Ilya、马斯克,亲述谷歌1084天背水一战内幕

从2022年ChatGPT发布引发谷歌内部“红色警报”,到1084天后Gemini3发布实现反超,谷歌在近三年的AI竞赛中完成从被动追赶到主动领跑的逆转。Gemini3展现出逻辑推...

OpenClaw删光Meta安全总监邮箱!连喊3次停手都没用,她狂奔去拔网线

2026年2月23日,Meta AI安全与对齐总监Summer Yue在测试邮箱验证开源AI智能体OpenClaw的邮件整理效果后,这么好使的东西,不用在真邮箱上用岂不浪费?决定将...
1 2 3 9