超越英伟达，天数智芯公布路线图

630 0 0

文章摘要

人工智能算力需求正从“有无”转向“好用与否”和“性价比”阶段，通用图形处理器（GPGPU）作为核心算力载体，面临真实场景的严苛检验。天数智芯近期公布的四代芯片架构路线图显示，其2025年天枢架构在特定场景性能已超越英伟达Hopper架构20%，后续天璇、天玑、天权架构将分别对标并超越Blackwell与Rubin架构，2027年后将转向突破性计算架构设计。这一技术突破基于多项创新：计算组广播机制减少数据重复访问，多指令并行系统提升复杂任务处理能力，动态线程组调度优化资源利用率，使AI芯片执行注意力机制时算力有效利用率达90%以上。

算力效率问题成为行业痛点。当前推理场景平均利用率不足20%，训练场景仅40%出头，粗放发展导致能效失衡与资源浪费。天数智芯提出高质量算力三大标准：通过优化总体拥有成本（TCO）实现高效率；借助精准仿真实现性能“所见即所得”的可预期性；以及支持现有及未来算法的可持续性。其架构设计不仅覆盖CNN、RNN和Transformer等主流模型，还预留了未来算法的适配空间。

边端计算领域迎来重大布局。随着AI向物理世界渗透，天数智芯推出“彤央”系列四款边端产品，实测稠密算力覆盖100-300TOPs，在多项基准测试中超越英伟达AGX Orin。TY1000算力模组以口袋尺寸集成开放生态，TY1100系列结合ARM处理器与自研GPU，TY1200终端以300TOPs性能支撑AIPC与具身智能。这些产品填补了从云端训练（天垓系列）、云端推理（智铠系列）到边端场景的全栈算力版图，实现国内唯一的云边端生态统一方案。

商业化落地成效显著。天数智芯产品已在20多个行业落地，支撑超1000家用户算法开发，其中300余家进入量产阶段。科学计算领域实现单集群数千卡并行且稳定运行超千天；互联网AI场景使单机性能翻倍而Token成本减半；医疗领域将病历生成时间压缩至30秒/份。2022-2024年公司营收复合增长率达68.8%，累计交付5.2万片GPU。最新彤央系列已应用于格蓝若机器人、瑞幸咖啡智能门店及车路协同试点城市。

技术底层创新持续深化。通过kv cache量化技术将模型推理内存占用降低50%，结合自研IX-SIMU系统动态优化硬件配置，显著缓解高内存成本压力。全栈自研战略覆盖从架构IP到编译器、驱动的完整链条，其SIMT架构与通算融合设计在ByteMLPerf测试中展现优于A800的吞吐量与首词延迟表现。公司明确拒绝简单跟随策略，强调原创突破，致力于成为定义行业标准的解决方案提供商，而非单纯芯片供应商。在物理AI与具身智能兴起的背景下，这一战略或将重塑国产算力的全球竞争格局。