GPU,警钟敲响!

AIGC动态1个月前发布 admin
570 0 0
GPU,警钟敲响!

 

文章摘要


【关 键 词】 GPU增长数据中心FMA操作AI芯片市场挑战

Nvidia的GPU在2023年经历了显著增长,数据中心GPU出货量达到约376万台,相较于2022年的264万台增长了100多万台。此外,2024年第二季度的季度GPU出货量比第一季度增长了1.8%,整体同比增长了16%。GPU的架构由多个处理器集群组成,每个集群包含多个流式多处理器(SM),这些SM负责执行并行任务、管理内存访问和执行计算。GPU特别适合处理内存延迟,因为其设计注重计算,减少了内存访问延迟的影响。

FMA(Fused Multiply-Add)操作是现代神经网络中的关键,它将乘法和加法合并为一个步骤,提高了计算效率和数值准确性。GPU特别适合执行并发矩阵乘法,这是由于其并行处理能力,数千个核心可以同时执行运算。GPU最初设计用于3D图形渲染,但随着时间的推移,它们变得更加通用和可编程,现在被用于各种计算密集型任务,如蛋白质折叠模拟和物理计算。

Nvidia开发了不同类型的GPU核心,包括CUDA核心、Tensor Cores和RT核心,分别用于通用并行处理、深度学习和人工智能以及实时光线追踪。Tensor Cores特别设计用于加速张量运算,这对于神经网络的训练和推理至关重要。GPU在数据中心和云环境中的能源效率尤为重要,因为它们在矩阵乘法任务中比CPU更节能。

然而,尽管Nvidia目前在市场上占据主导地位,但未来可能面临挑战。AMD首席执行官苏姿丰预测,随着行业转向更标准化的模型设计,可能会出现更多定制芯片,这些芯片在可编程性和灵活性方面要求较低,但更节能、体积更小、成本更低。大型云计算提供商如亚马逊和谷歌已经开发了自己的定制AI芯片,这些芯片专门用于执行特定功能。

市场情报公司IDC的副总裁Shane Rau指出,定制芯片在节能和成本方面具有优势,但商业化销售这些超级定制化专用芯片的市场仍不成熟。研究公司Gartner的副总裁分析师Chirag Dekate提到,高度定制的芯片存在灵活性和互操作性不足的问题。

尽管如此,许多芯片产品现在呈现出某种中间状态,一些GPU可以进行更多定制,一些专用芯片有一定程度的可编程性。这为芯片制造商提供了机会。AMD的苏姿丰认为,未来的AI模型将使用不同类型芯片的组合,包括GPU和更专门化的芯片。

分析师预测,到2026年,市场将需要选择,AMD和英特尔的市场份额可能会增加。超大规模公司可能会挑战Nvidia,因为他们将更多的AI服务转移到内部硬件上。此外,还有初创公司如Cerebras、SambaNova和Groq,它们希望通过新颖的解决方案蚕食Nvidia的市场份额。尽管许多初创公司可能会失败,但可能会有下一个Nvidia从幸存者中脱颖而出。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 3172字 | 13分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...