从铜到CPO:人工智能互连变了

AIGC动态2小时前发布 admin
63 0 0
从铜到CPO:人工智能互连变了

 

文章摘要


【关 键 词】 光互连SerDes挑战共封装光学人工智能系统带宽扩展

随着光收发器技术的持续进步,其在带宽、能效和集成度方面的突破正深刻影响着从数据中心到人工智能系统的架构设计。当前向光互连的过渡不仅由带宽需求驱动,更源于电控SerDes扩展性、系统功耗与物理限制间的矛盾激化。这种转变需要从规模化结构的连接特性切入分析。

在纵向扩展领域,紧密耦合的系统(如单台服务器或加速器域)追求极低延迟与高度同步的性能聚合。高速铜缆凭借成熟的SerDes技术(如NVLink)仍主导着短距离(<10米)的机架内互连场景。而横向扩展场景中,光互连则成为跨机架通信的基石,以太网和InfiniBand通过数十至数百米的光链路支撑着AI集群的吞吐量需求。典型AI加速器架构中,计算层通过铜缆连接L1交换机实现纵向扩展,而光模块在连接L2交换机的层级发挥关键作用。

SerDes技术虽持续从112G向224G PAM4演进,但电气通道的物理瓶颈日益凸显。信号完整性维护需要更强的均衡与DSP能力,导致每比特功耗攀升。对于配备数千条SerDes通道的AI系统,这种功耗累积可能使机架级热负载增加数百瓦,使SerDes从电路问题升级为架构级限制因素。共封装光学(CPO)技术通过将光引擎集成至交换机ASIC附近,有效缩短电气路径,降低I/O功耗达30%-50%,同时提升信号完整性与总带宽扩展潜力。

行业对光铜部署的分歧显现:NVIDIA等厂商在紧耦合GPU架构中坚持铜缆的低延迟优势,而Marvell等企业更积极在规模扩展中引入光链路。IDTechEx报告指出,AI架构演进将呈渐进式,铜缆在短距高效场景仍不可替代,但网络交换层的光学化已成明确趋势。随着加速器集群规模扩大,纵向扩展架构将面临功率密度与布线复杂度的挑战,可能促使光纤I/O在推理优化等延迟容忍场景渗透。

技术路线的本质是光铜协同的精细化分工:铜主导短距高可靠场景,光解决SerDes的功耗与距离瓶颈。CPO作为关键转折点,通过重构光电集成方式而非取代SerDes,为AI系统提供可持续的带宽增长路径。未来纵向/横向扩展界限可能模糊,但光电混合互连的范式将持续塑造算力基础设施的演进方向。

原文和模型


【原文链接】 阅读原文 [ 1796字 | 8分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...