7位专家拆解GTC,结论让英伟达难堪

AIGC动态2小时前发布 leifengwang
51 0 0
7位专家拆解GTC,结论让英伟达难堪

 

文章摘要


【关 键 词】 推理转型算力分工Token经济LPU崛起AI工厂

英伟达在GTC 2026发布会上明确转向“以推理为中心”的新战略,标志着AI基础设施逻辑的根本性调整。过去十年依赖GPU统一承担训练与推理任务的模式被打破,取而代之的是由GPU、CPU、LPU及专用单元构成的分层计算体系。黄仁勋强调,数据中心正被重新定义为“AI工厂”,其核心效能指标从单卡算力转向每瓦特产出的Token数量,“推理拐点已经到来” 成为贯穿全场的关键判断。Vera Rubin平台、LPX推理机架与Feynman架构共同构成新基础设施框架,其中LPU被专门用于优化Transformer推理中的Decode阶段,反映GPU在低延迟轻量推理场景中已非最优解;专家指出,LPU虽因高成本与工具链滞后暂难成为主力,但其入场清晰传递出推理任务细分化、硬件专业化的历史趋势。值得注意的是,CPX未被提及引发行业疑虑,显示英伟达策略或仍在动态调整中。

在经济模型层面,英伟达将Token定位为AI时代的“硬通货”,并宣称自身实现全球最低Token生产成本,以此支撑其2027年芯片营收达1万亿美元的激进预测——该数字仅涵盖Blackwell与Vera Rubin两条产品线,若计入CPU、存储与网络设备则可能升至1.25万亿美元. 算力竞争的度量体系正从芯片峰值参数转向系统级端到端能效,这一转变促使产业焦点从“算力垄断”转向“生态闭环”构建。英伟达通过绑定台积电、美光等上游厂商及云服务商,强化垂直整合能力,既对冲大厂自研ASIC带来的替代风险,也抬高系统交付门槛。然而,其庞杂的“全家桶”方案亦暴露焦虑:相比谷歌以极简ASIC+OCS架构实现更高吞吐效率,英伟达的“加法”路径面临规模扩张负担与路径依赖困境。

技术演进方面,第六代NVLink与全球首款CPO光电共封装交换机Spectrum-X亮相,旨在突破铜互联带宽瓶颈,但CPO当前受限于良率、运维成本与短距优势不足,推广仍处保守阶段。OpenClaw作为“智能体计算机”的操作系统被提升至Linux与Kubernetes同等战略高度,配合NemoClaw企业增强栈,推动SaaS向AaaS(智能体即服务)范式迁移;该转型不仅重塑商业模式,更倒逼基础设施从单一GPU驱动转向GPU+CPU双芯协同,因智能体编排、状态持久化等任务高度依赖CPU资源。业内共识认为,国产算力替代逻辑未受冲击,而未来竞争核心将聚焦于规模化Token生产能力与全栈系统整合能力,唯有Token成本降至如水电般低廉可负担,AI才能真正实现社会级普及

原文和模型


【原文链接】 阅读原文 [ 4514字 | 19分钟 ]
【原文作者】 雷峰网
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...