超越英伟达,天数智芯公布路线图

AIGC动态2小时前发布 admin
55 0 0
超越英伟达,天数智芯公布路线图

 

文章摘要


【关 键 词】 AI芯片算力需求国产GPU高性能计算边端产品

人工智能算力需求正从“有无”转向“好用与否”和“性价比”阶段,通用图形处理器(GPGPU)作为核心算力载体,面临真实场景的严苛检验。天数智芯近期公布的四代芯片架构路线图显示,其2025年天枢架构在特定场景性能已超越英伟达Hopper架构20%,后续天璇、天玑、天权架构将分别对标并超越Blackwell与Rubin架构,2027年后将转向突破性计算架构设计。这一技术突破基于多项创新:计算组广播机制减少数据重复访问,多指令并行系统提升复杂任务处理能力,动态线程组调度优化资源利用率,使AI芯片执行注意力机制时算力有效利用率达90%以上。

算力效率问题成为行业痛点。当前推理场景平均利用率不足20%,训练场景仅40%出头,粗放发展导致能效失衡与资源浪费。天数智芯提出高质量算力三大标准:通过优化总体拥有成本(TCO)实现高效率;借助精准仿真实现性能“所见即所得”的可预期性;以及支持现有及未来算法的可持续性。其架构设计不仅覆盖CNN、RNN和Transformer等主流模型,还预留了未来算法的适配空间。

边端计算领域迎来重大布局。随着AI向物理世界渗透,天数智芯推出“彤央”系列四款边端产品,实测稠密算力覆盖100-300TOPs,在多项基准测试中超越英伟达AGX Orin。TY1000算力模组以口袋尺寸集成开放生态,TY1100系列结合ARM处理器与自研GPU,TY1200终端以300TOPs性能支撑AIPC与具身智能。这些产品填补了从云端训练(天垓系列)、云端推理(智铠系列)到边端场景的全栈算力版图,实现国内唯一的云边端生态统一方案。

商业化落地成效显著。天数智芯产品已在20多个行业落地,支撑超1000家用户算法开发,其中300余家进入量产阶段。科学计算领域实现单集群数千卡并行且稳定运行超千天;互联网AI场景使单机性能翻倍而Token成本减半;医疗领域将病历生成时间压缩至30秒/份。2022-2024年公司营收复合增长率达68.8%,累计交付5.2万片GPU。最新彤央系列已应用于格蓝若机器人、瑞幸咖啡智能门店及车路协同试点城市。

技术底层创新持续深化。通过kv cache量化技术将模型推理内存占用降低50%,结合自研IX-SIMU系统动态优化硬件配置,显著缓解高内存成本压力。全栈自研战略覆盖从架构IP到编译器、驱动的完整链条,其SIMT架构与通算融合设计在ByteMLPerf测试中展现优于A800的吞吐量与首词延迟表现。公司明确拒绝简单跟随策略,强调原创突破,致力于成为定义行业标准的解决方案提供商,而非单纯芯片供应商。在物理AI与具身智能兴起的背景下,这一战略或将重塑国产算力的全球竞争格局。

原文和模型


【原文链接】 阅读原文 [ 4091字 | 17分钟 ]
【原文作者】 半导体行业观察
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...