拆掉Token暴利墙,云厂商下场造芯 | 企服国际观察
文章摘要
【关 键 词】 自研芯片、云计算、算力成本、降本增效、大模型
全球头部云计算厂商正加速推进自研芯片战略,其发展路径已从早期的内部业务降本,逐步演变为争夺市场话语权与重构AI基础设施的核心手段。在Agent爆发与大模型训推需求激增的背景下,自研芯片成为云厂商降低对外部供应商依赖、将硬件利润留存于平台的关键布局。海外三大云厂商的技术路线呈现明显分化:AWS采取训推一体化策略,通过Trainium与Graviton组合覆盖全场景;谷歌将第八代TPU拆分为训练与推理专用芯片,强调专用化带来的效能提升;微软则聚焦推理侧优化,Maia 200深度绑定Azure生态与企业级应用。市场反馈显示,自研芯片在总体拥有成本上已对传统GPU厂商形成竞争压力,并成功吸引头部大模型企业达成巨额采购与合作。
云厂商角色已由单纯的算力出租方转向一体化基础设施提供商,核心目标在于拆除“Token暴利墙”并压低单位推理成本。随着AI需求向重资产、高集中度演变,传统租赁模式难以满足规模化应用需求。为此,各大云厂商大幅上调资本开支,将资金密集投入芯片研发、网络架构与软件栈的协同设计。财务回报的实现取决于推理成本的实际降幅、客户使用规模的扩张以及自研芯片与大模型托管服务的商业融合。与此同时,国内云厂商在GPU供应受限的背景下,侧重供应链可控与万卡集群的Scale-out互联方案,通过软硬件协同构建大算力底座,形成差异化的竞争路径。
芯片业务虽未必直接构成利润中心,但将直接决定云服务的利润上限与未来AI市场的定价权。短期内传统GPU厂商的主导地位仍难被彻底颠覆,但大模型场景对集中式算力的依赖已打破传统云计算的资源池化与超卖逻辑。云厂商持续加码造芯投入,本质上是围绕算力成本与生态绑定展开的长期基础设施博弈。谁能更高效地压缩Token成本并实现底层硬件的自主可控,谁便能在AI商业化进程中掌握主动权,推动大模型应用走向可持续的盈利模式。
原文和模型
【原文链接】 阅读原文 [ 2560字 | 11分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 qwen3.6-max-preview
【摘要评分】 ★★★★☆



