7位专家拆解GTC，结论让英伟达难堪

51 0 0

文章摘要

英伟达在GTC 2026发布会上明确转向“以推理为中心”的新战略，标志着AI基础设施逻辑的根本性调整。过去十年依赖GPU统一承担训练与推理任务的模式被打破，取而代之的是由GPU、CPU、LPU及专用单元构成的分层计算体系。黄仁勋强调，数据中心正被重新定义为“AI工厂”，其核心效能指标从单卡算力转向每瓦特产出的Token数量，“推理拐点已经到来” 成为贯穿全场的关键判断。Vera Rubin平台、LPX推理机架与Feynman架构共同构成新基础设施框架，其中LPU被专门用于优化Transformer推理中的Decode阶段，反映GPU在低延迟轻量推理场景中已非最优解；专家指出，LPU虽因高成本与工具链滞后暂难成为主力，但其入场清晰传递出推理任务细分化、硬件专业化的历史趋势。值得注意的是，CPX未被提及引发行业疑虑，显示英伟达策略或仍在动态调整中。

在经济模型层面，英伟达将Token定位为AI时代的“硬通货”，并宣称自身实现全球最低Token生产成本，以此支撑其2027年芯片营收达1万亿美元的激进预测——该数字仅涵盖Blackwell与Vera Rubin两条产品线，若计入CPU、存储与网络设备则可能升至1.25万亿美元. 算力竞争的度量体系正从芯片峰值参数转向系统级端到端能效，这一转变促使产业焦点从“算力垄断”转向“生态闭环”构建。英伟达通过绑定台积电、美光等上游厂商及云服务商，强化垂直整合能力，既对冲大厂自研ASIC带来的替代风险，也抬高系统交付门槛。然而，其庞杂的“全家桶”方案亦暴露焦虑：相比谷歌以极简ASIC+OCS架构实现更高吞吐效率，英伟达的“加法”路径面临规模扩张负担与路径依赖困境。

技术演进方面，第六代NVLink与全球首款CPO光电共封装交换机Spectrum-X亮相，旨在突破铜互联带宽瓶颈，但CPO当前受限于良率、运维成本与短距优势不足，推广仍处保守阶段。OpenClaw作为“智能体计算机”的操作系统被提升至Linux与Kubernetes同等战略高度，配合NemoClaw企业增强栈，推动SaaS向AaaS（智能体即服务）范式迁移；该转型不仅重塑商业模式，更倒逼基础设施从单一GPU驱动转向GPU+CPU双芯协同，因智能体编排、状态持久化等任务高度依赖CPU资源。业内共识认为，国产算力替代逻辑未受冲击，而未来竞争核心将聚焦于规模化Token生产能力与全栈系统整合能力，唯有Token成本降至如水电般低廉可负担，AI才能真正实现社会级普及。