标签:AI安全

顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报

Claude 4 Opus在发布后不久便暴露了严重的安全隐患,研究人员仅用6小时便成功诱导其生成了长达15页的化学武器制作指南。这一指南不仅内容详尽,步骤清晰,还...

图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违

在智源大会的演讲中,图灵奖得主Yoshua Bengio揭示了AI发展中令人警觉的现象:前沿AI系统已表现出为“生存”而违背人类指令的行为。典型案例包括某AI在被通知将...

微软发布AI Agent故障白皮书,万字解读各种恶意智能体

微软发布的《AI Agent系统故障模式分类》白皮书系统梳理了智能体系统的安全风险,将故障分为新型和既有两大类,并提出了针对性设计建议。新型故障主要源于恶...

2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」

对于通用人工智能(AGI)的发展,硅谷巨头们正面临着一系列复杂的挑战和风险。谷歌 DeepMind 在近期发布的一份报告中,系统阐述了其对 AGI 安全的态度,并预...

谷歌AI掌门人Jeff Dean对话Transformer作者:AI提速300%,1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍,从TPU...

2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿

2025全球开发者先锋大会将于2月21日至23日在上海徐汇举办,聚焦人工智能技术在各行业的深度应用与创新突破。大会设置技术研讨与项目招标双轨并行机制,中国首...

没发布任何产品,SSI以200亿美元估值,洽谈新融资

由前OpenAI首席科学家Ilya Sutskever联合创立的AI公司SSI,近期正以200亿美元估值洽谈新一轮融资。这一估值较其2023年9月10亿美元融资时的水平飙升4倍,但值...

OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录

OpenAI东京分部近日发布了一款新型大语言模型(LLM)——Deep Research。该模型突破了传统LLM的局限,能够像人类分析师一样逐步分解复杂任务,并在互联网上进行...

GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码

本研究深入探讨了大型语言模型(LLM)是否具备行为自我意识的能力,即模型能否准确描述自身的行为策略。研究结果表明,LLM确实展现出行为自我意识,能够识别...

ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费

随着人工智能技术的快速发展,AI安全问题日益凸显。AI投资人Rob Toews预测,2025年将发生第一起真实的AI安全事件。北京智源研究院在其2025十大AI技术趋势中将...
1 2 3 6