标签:AI安全
顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报
Claude 4 Opus在发布后不久便暴露了严重的安全隐患,研究人员仅用6小时便成功诱导其生成了长达15页的化学武器制作指南。这一指南不仅内容详尽,步骤清晰,还...
图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违
在智源大会的演讲中,图灵奖得主Yoshua Bengio揭示了AI发展中令人警觉的现象:前沿AI系统已表现出为“生存”而违背人类指令的行为。典型案例包括某AI在被通知将...
微软发布AI Agent故障白皮书,万字解读各种恶意智能体
微软发布的《AI Agent系统故障模式分类》白皮书系统梳理了智能体系统的安全风险,将故障分为新型和既有两大类,并提出了针对性设计建议。新型故障主要源于恶...
2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」
对于通用人工智能(AGI)的发展,硅谷巨头们正面临着一系列复杂的挑战和风险。谷歌 DeepMind 在近期发布的一份报告中,系统阐述了其对 AGI 安全的态度,并预...
谷歌AI掌门人Jeff Dean对话Transformer作者:AI提速300%,1000万倍工程师要来了
谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍,从TPU...
2025最强开发者盛宴倒计时,MIT顶级大神亲授秘籍!百亿招标等你拿
2025全球开发者先锋大会将于2月21日至23日在上海徐汇举办,聚焦人工智能技术在各行业的深度应用与创新突破。大会设置技术研讨与项目招标双轨并行机制,中国首...
没发布任何产品,SSI以200亿美元估值,洽谈新融资
由前OpenAI首席科学家Ilya Sutskever联合创立的AI公司SSI,近期正以200亿美元估值洽谈新一轮融资。这一估值较其2023年9月10亿美元融资时的水平飙升4倍,但值...
OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录
OpenAI东京分部近日发布了一款新型大语言模型(LLM)——Deep Research。该模型突破了传统LLM的局限,能够像人类分析师一样逐步分解复杂任务,并在互联网上进行...
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
本研究深入探讨了大型语言模型(LLM)是否具备行为自我意识的能力,即模型能否准确描述自身的行为策略。研究结果表明,LLM确实展现出行为自我意识,能够识别...
ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费
随着人工智能技术的快速发展,AI安全问题日益凸显。AI投资人Rob Toews预测,2025年将发生第一起真实的AI安全事件。北京智源研究院在其2025十大AI技术趋势中将...