GPU，警钟敲响！

2,063 0 0

文章摘要

Nvidia的GPU在2023年经历了显著增长，数据中心GPU出货量达到约376万台，相较于2022年的264万台增长了100多万台。此外，2024年第二季度的季度GPU出货量比第一季度增长了1.8%，整体同比增长了16%。GPU的架构由多个处理器集群组成，每个集群包含多个流式多处理器（SM），这些SM负责执行并行任务、管理内存访问和执行计算。GPU特别适合处理内存延迟，因为其设计注重计算，减少了内存访问延迟的影响。

FMA（Fused Multiply-Add）操作是现代神经网络中的关键，它将乘法和加法合并为一个步骤，提高了计算效率和数值准确性。GPU特别适合执行并发矩阵乘法，这是由于其并行处理能力，数千个核心可以同时执行运算。GPU最初设计用于3D图形渲染，但随着时间的推移，它们变得更加通用和可编程，现在被用于各种计算密集型任务，如蛋白质折叠模拟和物理计算。

Nvidia开发了不同类型的GPU核心，包括CUDA核心、Tensor Cores和RT核心，分别用于通用并行处理、深度学习和人工智能以及实时光线追踪。Tensor Cores特别设计用于加速张量运算，这对于神经网络的训练和推理至关重要。GPU在数据中心和云环境中的能源效率尤为重要，因为它们在矩阵乘法任务中比CPU更节能。

然而，尽管Nvidia目前在市场上占据主导地位，但未来可能面临挑战。AMD首席执行官苏姿丰预测，随着行业转向更标准化的模型设计，可能会出现更多定制芯片，这些芯片在可编程性和灵活性方面要求较低，但更节能、体积更小、成本更低。大型云计算提供商如亚马逊和谷歌已经开发了自己的定制AI芯片，这些芯片专门用于执行特定功能。

市场情报公司IDC的副总裁Shane Rau指出，定制芯片在节能和成本方面具有优势，但商业化销售这些超级定制化专用芯片的市场仍不成熟。研究公司Gartner的副总裁分析师Chirag Dekate提到，高度定制的芯片存在灵活性和互操作性不足的问题。

尽管如此，许多芯片产品现在呈现出某种中间状态，一些GPU可以进行更多定制，一些专用芯片有一定程度的可编程性。这为芯片制造商提供了机会。AMD的苏姿丰认为，未来的AI模型将使用不同类型芯片的组合，包括GPU和更专门化的芯片。

分析师预测，到2026年，市场将需要选择，AMD和英特尔的市场份额可能会增加。超大规模公司可能会挑战Nvidia，因为他们将更多的AI服务转移到内部硬件上。此外，还有初创公司如Cerebras、SambaNova和Groq，它们希望通过新颖的解决方案蚕食Nvidia的市场份额。尽管许多初创公司可能会失败，但可能会有下一个Nvidia从幸存者中脱颖而出。