标签:算子优化

华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源

2025年标志着大模型从单点工具向业务系统底层基础设施的转型,其中推理效率成为决定模型能否实际落地的关键因素。超大规模混合专家(MoE)模型面临计算、通信...