文章摘要
【关 键 词】 AGI、多模态、模型架构、技术突破、未来预测
谷歌DeepMind CEO Hassabis预测,2030年前将实现具备或超越人类能力的通用人工智能(AGI)。他认为,当前AI系统虽已取得显著进展,但仍需1-2个类似Transformer或AlphaGo级别的突破才能达成这一目标。多模态融合、类人视觉智能、语言与视频深度结合、世界模型及可靠智能体被列为未来12个月的关键趋势。Hassabis强调,扩展现有AI系统规模将成为AGI的“关键构件”,但同时也警示了AI滥用可能带来的灭绝级风险,呼吁投入资源应对这类威胁。
DeepMind最新发布的Titans架构被视为Transformer的潜在继任者。该架构结合了RNN的响应速度与Transformer的性能优势,在200万token级上下文中展现出卓越的召回率和准确率。配套的MIRAS框架通过动态更新核心记忆和自适应遗忘机制,解决了传统Transformer扩展时计算成本飙升的瓶颈。Titans通过“惊奇度”指标优先存储关键信息,其长期记忆模块采用多层感知机(MLP)结构,能够主动理解并串联输入内容的深层关系。
Gemini模型展现出意料之外的抽象理解能力。Hassabis指出,Gemini 3具备分析视频场景象征意义等“元认知”潜力,但开发团队对其功能的探索不足10%。用户常将模型应用于开发者未曾设想的场景,凸显了多模态AI的广阔应用空间。目前大语言模型仍存在能力不均衡问题,缺乏持续学习、多步推理等关键智能特征,而真正的AGI需实现各项认知能力的稳定整合。
技术突破与伦理挑战并存。Hassabis描绘了AGI可能带来的“后稀缺时代”图景:清洁能源、疾病攻克等重大问题的解决将重塑人类社会。但他也反思,技术全面突破后人类存在的意义可能面临重新定义。谷歌在NeurIPS大会同步发布的MIRAS框架为序列建模提供统一视角,其构建的无注意力模型(YAAD、MONETA等)在语言建模任务中性能超越现有基线,BABILong基准测试显示Titans在超长上下文推理领域显著领先GPT-4等模型。这些进展表明,架构层面的记忆补全与多模态能力的进化正加速AGI的到来。
原文和模型
【原文链接】 阅读原文 [ 2905字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆



