瞄准AI、图形顶端战场:摩尔线程上演国产GPU硬核实力路演

瞄准AI、图形顶端战场:摩尔线程上演国产GPU硬核实力路演

 

文章摘要


【关 键 词】 GPU人工智能计算卡芯片国产技术

摩尔线程在首届 MUSA 开发者大会上展示了其新一代统一计算架构 MUSA 的技术路线图,并密集发布了一系列硬件与软件产品。其中,AI 计算卡 S5000 以每秒 1024 token 的解码速度和超过 4000 token 的峰值吞吐表现,刷新了国产 GPU 的推理性能记录。该计算卡搭载于通用服务器上,验证了其高效、稳定的低延迟算力,成为国产算力的重要里程碑。

技术底座 MUSA(元计算统一系统架构)是贯穿摩尔线程全栈产品的核心体系,覆盖芯片架构、指令集、编程模型及软件生态。新发布的「花港」全功能 GPU 架构在算力密度和能效比上实现显著突破,同芯片面积下算力密度提升 50%,能效提升 10 倍。该架构支持 FP4 至 FP64 的全精度计算,并集成异步编程模型和自研 MTLink 互联技术,片间互联速度达 1314GB/s,支持十万卡规模集群扩展。图形处理方面,「花港」首次完整支持 DirectX 12 Ultimate,光线追踪性能提升 50 倍,并引入 AI 生成式渲染架构(AGR)。

基于「花港」架构,摩尔线程公布了两款下一代芯片:面向 AI 计算的「华山」和专注图形渲染的「庐山」。「华山」在浮点计算能力上对标 NVIDIA Hopper 与 Blackwell 之间水平,内置大语言模型专用加速引擎,支持 1024 卡高速互联。「庐山」则通过 AI 生成式渲染和第二代光线追踪引擎,将 3A 游戏性能提升 15 倍,并宣称具备全球最高几何能力,可覆盖专业设计需求。

在集群能力上,夸娥(KUAE2.0)万卡智算集群展示出 10 Exa-FLOPS 算力,大模型训练算力利用率超 60%,线性加速比达 95%。超级节点产品 MTT C256 通过单层网络实现 256GPU 全互联,优化智算中心部署密度。摩尔线程还前瞻布局具身智能、科学智能、量子计算等领域,推出 MT Lambda 仿真训练平台和端云结合的机器人解决方案。

为构建生态,摩尔线程发起「摩尔学院」和「MUSA 开发者计划」,覆盖高校教育与行业实践。面向个人开发者的 MTT AIBOOK 笔记本搭载异构 AI 算力 50TOPS 的「长江」芯片,可本地运行 30B 参数大模型,支持多系统环境与开箱即用的 AI 开发工具。这一系列技术突破与产品布局,标志着国产算力在性能、生态和应用场景上的全面进阶。

原文和模型


【原文链接】 阅读原文 [ 3407字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...